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Prefácio 


Nos últimos anos, a Álgebra Linear se tornou parte essencial do conhecimento matemático básico exigido de ma- 
temáticos e professores de Matemática, engenheiros, cientistas da computação, físicos, economistas e estatísticos, 
entre outros. Essa exigência reflete a importância e as múltiplas aplicações desse assunto. 

Este livro foi desenvolvido para ser usado como livro-texto na disciplina de Álgebra Linear mas também pode 
ser usado como suplemento para outros livros. Apresenta uma introdução à Álgebra Linear que se mostrará útil a 
todos os leitores, independentemente de suas áreas de especialização. Incluiu-se mais material do que pode ser 
abordado na maioria dos cursos iniciais. Fizemos isso para tornar o livro mais flexível, para torná-lo um livro de 
referência útil e para estimular um maior desenvolvimento do material. 

Cada capítulo começa com afirmações claras das definições, princípios e teoremas pertinentes, junto com ma- 
terial descritivo e ilustrativo adicional. A isso se segue um conjunto de exercícios graduais resolvidos e problemas 
complementares. Os problemas resolvidos servem para ilustrar e ampliar a teoria e fornecem a repetição de princí- 
pios básicos tão vital para o aprendizado. Várias demonstrações, especialmente as de todos os teoremas essenciais, 
estão incluídas entre os problemas resolvidos. Os problemas complementares servem como uma revisão completa 
do conteúdo de cada capítulo. 

Nos três primeiros capítulos, tratamos de vetores no espaço euclidiano, álgebra de matrizes e sistemas de equa- 
ções lineares. Esses capítulos proporcionam a motivação e as ferramentas computacionais básicas para as investi- 
gações abstratas de espaços vetoriais e transformações lineares que seguem. Depois de capítulos referentes a pro- 
duto interno e ortogonalidade e determinantes, apresentamos uma discussão detalhada de autovalores e autovetores, 
dando condições para a representação de um operador linear por uma matriz diagonal. Isto leva naturalmente ao 
estudo das várias formas canônicas, especialmente a triangular, a de Jordan e a racional. Nos últimos capítulos, 
estudamos funcionais lineares e o espaço dual V*, bem como formas bilineares, quadráticas e hermitianas. No úl- 
timo capítulo, tratamos de operadores lineares em espaços com produto interno. 

As principais alterações desta quarta edição ocorreram nos apêndices. Expandimos o Apêndice A relativo a 
produtos tensorial e exterior de espaços vetoriais, incluindo demonstrações de existência e unicidade desses produ- 
tos. Acrescentamos apêndices relativos a estruturas algébricas, inclusive módulos e polinômios sobre um corpo e 
no Apêndice Miscelânea incluímos a inversa generalizada de Moore-Penrose, utilizada em várias aplicações, como 
na Estatística. Também introduzimos novos problemas resolvidos e complementares. 

Finalmente, gostaríamos de agradecer à equipe da Coleção Schaum da McGraw-Hill, especialmente a Charles 
Wall, por sua constante cooperação. 

SEYMOUR LIPSCHUTZ 
MARC LARS LIPSON 
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Vetores em R” e C”, 
Vetores Espaciais 


1.1 INTRODUÇÃO 


A noção de vetor pode ser motivada ou por uma lista de números e índices, ou por meio de certos objetos da Física. 
Vejamos ambas maneiras. 

Para isso, vamos supor que o leitor esteja familiarizado com as propriedades elementares do corpo dos números 
reais, denotado por R. Além desse corpo, vamos revisar algumas propriedades do corpo dos números complexos, 
denotado por C. No contexto de vetores, os elementos de nossos corpos numéricos são denominados escalares. 

Mesmo que neste capítulo nos restrinjamos a vetores cujos elementos provenham de R e, mais tarde, de C, muitas 
das nossas operações também são aplicáveis a vetores cujas entradas sejam provenientes de algum corpo arbitrário K. 


Lista de números 
Digamos que os pesos (em kg) de oito universitários sejam dados pela lista 
78, 63, 73, 62, 88, 13, 81,97. 


Utilizando apenas um símbolo, digamos, w, e índices subscritos distintos, podemos denotar os oito valores dessa 
lista, como segue. 


Wis Wa, W3, Wys Wss Wos Was Wg 
Observe que cada índice denota a posição do valor na lista. Por exemplo, 
w, = 78, o primeiro número, w, = 63, o segundo número da lista, ... 
Uma lista de valores como essa, 
w = (Wi, Wz, Wa o Wg), 


é denominada tabela linear ou vetor. 


Vetores na Física 


Muitas grandezas físicas, como temperatura e velocidade escalar, possuem apenas “magnitude”. Essas grandezas 
podem ser representadas por números reais e são denominadas escalares. Além dessas, também existem grandezas, 
como força e velocidade, que possuem tanto “magnitude” quanto “direção” e “sentido”. Essas grandezas são deno- 
minadas vetores e podem ser representadas por setas que começam em algum ponto referencial O dado, sendo 
dotadas de comprimento, direção e sentido apropriados. 

Agora vamos supor que o leitor também esteja familiarizado com o espaço Rî, em que todos os pontos são 
representados por ternos ordenados de números reais. Suponha que para o ponto referencial O mencionado esco- 
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(a+a, b+b', c+) 
z A 


(ra, rb,rc) 


=y 


(a) Soma de vetores (b) Multiplicação por escalar 
Figura 1-1 


lhamos a origem dos eixos de R°. Então, cada vetor é determinado de maneira única pelas coordenadas de seu 
ponto final e vice-versa. 

Existem duas operações importantes associadas aos vetores da Física, a soma de vetores e a multiplicação por 
escalar. Vejamos a definição dessas operações e as relações entre essas operações e os pontos finais dos vetores. 


(1) Soma de vetores. O vetor resultante u + v de dois vetores u e v é obtido pela lei do paralelogramo, que diz 
que u + v é a diagonal do paralelogramo formado por u e v. Além disso, se (a, b, c) e (a', b', c') forem os pontos finais 
dos vetores u e v, então o ponto final do vetor u + v será dado por (a + a', b + b', c + c'. Essas propriedades podem 
ser vistas na Figura 1-1(a). 

Gi) Multiplicação por escalar. O múltiplo ru de um vetor u por um número real r é o vetor de mesma direção de 
u que é obtido multiplicando-se o tamanho de u por r e mantendo o mesmo sentido se [r > 0] ou invertendo o sentido se 
[r<0]. Além disso, se (a, b, c) for o ponto final do vetor u, então (ra, rb, rc) é o ponto final do vetor ru. Essas proprie- 
dades podem ser vistas na Figura 1-1(b). 


Matematicamente, identificamos o vetor u com (a, b, c) e escrevemos u = (a, b, c). Além disso, o terno orde- 
nado (a, b, c) de números reais é denominado ponto ou vetor, dependendo da interpretação. Generalizamos essa 
noção e dizemos que uma ênupla (a,, a, ..., a,) de números reais é um vetor. Entretanto, para os vetores de R, 
denominados vetores espaciais, podemos usar notação especial (Seção 1.6). 


1.2 VETORES DE R” 


O conjunto de todas as ênuplas de números reais, denotado por R”, é chamado de espaço n-dimensional. Uma 
ênupla específica de R”, digamos, 


u=(a, a... a), 


é denominada ponto ou vetor. Os números a, são denominados coordenadas, componentes ou entradas de u. Além 
disso, quando trabalhamos com o espaço R”, usamos o termo escalar para os elementos de R. 

Dizemos que dois vetores u e v são iguais, e escrevemos u = v, se possuírem o mesmo número de componentes 
e se os componentes correspondentes forem iguais. Embora os vetores (1, 2, 3) e (2, 3, 1) contenham os mesmos 
três números, esses vetores não são iguais, porque as entradas correspondentes não são iguais. 

O vetor (0, 0, ..., 0), cujas entradas são todas 0, é denominado vetor nulo, ou vetor zero, e costuma ser denotado 
por 0. 


Exemplo 1.1 
(a) São vetores 
(2,-5), (7,9), (0,0,0) e (3,4,5). 
Os dois primeiros pertencem a R’, enquanto os dois últimos pertencem a R°. O terceiro é o vetor nulo de R°. 
(b) Encontre x, y e z tais que (x — y, x + y,z — 1) = (4, 2, 3). 
Pela definição de igualdade de vetores, os componentes correspondentes devem ser iguais. Assim, 
x—y=4, x+y=2, z—1=3 


Resolvendo esse sistema de equações, obtemos x = 4, y = —1,z = 4. 
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Vetores coluna 


Às vezes, escrevemos um vetor do espaço n-dimensional R” verticalmente em vez de horizontalmente. Dizemos que 
um vetor desses é um vetor coluna e, nesse contexto, os vetores do Exemplo 1.1 escritos na forma horizontal são 
denominados vetores linha. Por exemplo, seguem vetores coluna com 2, 2, 3 e 3 componentes, respectivamente. 


1,5 
q ta 9 T5 
A —4 | , 3 
za -15 


Também observamos que qualquer operação definida para vetores linha está definida para vetores coluna de ma- 
neira análoga. 


1.3 SOMA DE VETORES E MULTIPLICAÇÃO POR ESCALAR 
Considere dois vetores u e v de R”, digamos 


u = (di; Ayy e Ap) e v=(D,b,..,b,) 


, i 7n 
A soma u + v desses vetores é o vetor obtido somando os componentes correspondentes de u e v, ou seja, 
u + v= (a + b,a + b»... a, + b) 


A multiplicação por escalar ru do vetor u pelo número real r é o vetor obtido pela multiplicação de cada compo- 
nente de u por r, ou seja, 


ru = (a, O, o E) = (Taiz TA, os rA) 


n 


Observe que u + v e ru também são vetores de R”. Não se define a soma entre vetores com número distinto de 
componentes. 
O oposto de um vetor e a subtração de vetores em R” são dados por 


—u = (—1u e u — v= u + (v) 


O vetor —u é denominado oposto ou negativo de u e u — v é a diferença de u e v. 

Agora suponha que sejam dados os vetores u, U», ..., u de R” e os escalares r,, r», ..., r, de R. Podemos multi- 
plicar os vetores pelos escalares correspondentes e então somar os múltiplos escalares resultantes para constituir o 
vetor 


v=rm+ru,+rmu+e+ru 


mm 


Um vetor v desses é denominado combinação linear dos vetores u,, u, ..., U 


mº 


Exemplo 1.2 
(a) Sejam u = (2,4, -5) e v = (1, —6, 9). Então 


a 4+(-5), —5 +9) = (3, —1,4) 
= (7(2),7(4),7(—5)) = (14,28, —35) 
= (—1)(1,-6,9) = (-1,6,-9) 
aa 15) + (—5, 30, —45) = (1,42, 60) 


ns 


(b) O vetor zero O = (0,0, ..., 0) de R é semelhante ao escalar O no seguinte sentido. Dado qualquer vetor u = 
(a, 4, ..., 4,), temos 


u+0=(a,+0,0,+0,..,.a,+0)=(a,a,..,a)=u 
2 3 4 =9 =5 
(c) Sejamu = 3 Jev = | —1 | Então 2u — 3v = 6| + 3| = 9 |, 
—4 —2 —8 6 =2 
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As propriedades básicas dos vetores sujeitos às operações de adição de vetores e de multiplicação por escalar 
são dadas no teorema a seguir. 


Teorema 1.1 Dados quaisquer vetores u, ve w em R" e escalares r e 7 em R, 


(1) (u+ v)+w=u + (w+ w), (v) r(u + v)= ru + rv, 
(1) u+0=u, (vi) (r + ru = ru + r'u, 
Gii) u + (-u) = 0, (vi) (ru = r(ru), 

Gv) utv=v+u, (vii) lu=u. 


A demonstração do Teorema 1.1 será dada no Capítulo 2, onde aparece no contexto de matrizes (Problema 2.3). 

Suponha que u e v sejam vetores de R” tais que u = rv para algum escalar não nulo r de R. Então dizemos 
que u é um múltiplo de v. Dizemos, também, que u tem o mesmo sentido que v se [r > 0] ou sentido oposto ao de 
v[r<0]. 


1.4 PRODUTO ESCALAR (OU INTERNO) 


Considere dois vetores quaisquer u e v de R”, digamos, 


u=(a, az ...,4,) e v=(b,b,...,b,) 


O produto escalar, ou produto interno, de u e v é denotado e definido por 
u: v = a;b +ab,+--:+a,b, 
Ou seja, u - v é obtido com a multiplicação dos componentes correspondentes e com a soma dos produtos resultan- 
tes. Dizemos que os vetores u e v são ortogonais, ou perpendiculares, se seu produto escalar for nulo, ou seja, se 
uv=0. 
Exemplo 1.3 
(a) Sejam u = (1,-2,3),v= (4,5,-Dew = (2, 7,4). Então 
u- v= 1(4)- 2(5)+3(-1)=4- 10-3 = -9 
uw=2-14+12=0, vw=8+35-4=39 


Assim, u e w são ortogonais. 


2 3 
(b) Sejam u = 3 e v= |-—l1 |. Entãou-v=6-34+8=11. 
—4 —2 


(c) Considere u = (1,2,3, 4) e v= (6,r,—8,2). Encontre r tal que u e v sejam ortogonais. 
Inicialmente obtemos u : v = 6 + 2r — 24 + 8 = —10 + 2r. Faça então u - v = 0 e resolva para r: 


-10 + 2r=0 ou 2r= 10 ou r=5 


Seguem as propriedades básicas do produto escalar de R”(mostradas no Problema 1.13). 
Teorema 1.2 Dados quaisquer vetores u, ve w em R” e escalar r em R, 
O) (ut) w=uw+vw, (ii) uv=v-u, 


Gi) (ru)-v=r(u-v), (iv) u-u>0, se esóse,u=o0. 


Observe que (ii) afirma que “podemos tirar r para fora” da primeira posição de um produto escalar. A partir de (iii) 
e (11), obtemos 


u(ro)=(ro)-u=r(v-u)=r(u-v) 


Ou seja, também “podemos tirar r para fora” da segunda posição de um produto escalar. 
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O espaço R” com essas operações de adição de vetores, multiplicação por escalar e produto escalar costuma ser 
denominado espaço euclidiano n-dimensional. 


Norma (ou comprimento) de um vetor 


A norma ou comprimento de um vetor u de R", denotado por |Ju||, é definido como a raiz quadrada não negativa de 
u -u. Em particular, se u = (a,, a, ..., a,), então 


Jull = Vau = Varas a 


Ou seja, ||u 
u =Q. 
Dizemos que um vetor u é unitário se ||u|| = 1 ou, de modo equivalente, se u - u = 1. Dado qualquer vetor não 
nulo v de R”, o vetor 
1 


v 
SEA 
lell ol) 


é a raiz quadrada da soma dos quadrados dos componentes de u. Assim, |jul| = 0 e |Jul| = O se, e só se, 


= 


é o único vetor unitário de mesma direção e mesmo sentido de v. O processo de encontrar à a partir de v é denomi- 
nado normalização de v. 
Exemplo 1.4 


(a) Sejau = (1, —2, —4,5,3). Para obter ||ul|, podemos calcular primeiro |/ul tomando o quadrado de cada com- 
ponente e somando, como segue. 


lul? = 12 + (=2}? + (4) +5? +32 =1+4+16+25+9= 55 


Então ||u|| = v55. 


(b) Sejam v = (1, -3, 4, 2)e w = ($, — 4,2,1). Então 


9 1 25 1l 36 
EIS j M- yatita ea] 


Assim, w é um vetor unitário, mas não v. Contudo, podemos normalizar v. 


A v ( 1 -3 4 2 ) 
v= = ti , b) 
lell 130 30 30 v30 
Esse é o único vetor unitário com a mesma direção e sentido de v. 


A fórmula seguinte (que será demonstrada no Problema 1.14) é conhecida como a desigualdade de Schwarz, 
ou então, desigualdade de Cauchy-Schwarz. Ela é utilizada em muitos ramos da Matemática. 


Teorema 1.3 (Schwarz) Dados quaisquer vetores u e v de R”, |u - v| < IJul|||vl). 


Usando essa desigualdade, também demonstramos (Problema 1.15) o seguinte resultado, conhecido como “desi- 
gualdade triangular”, ou desigualdade de Minkowski. 


Teorema 1.4 (Minkowski) Dados quaisquer vetores u e v de R”, |ju + v|| < [jul] + Ilol]. 


Distância, ângulos e projeções 


A distância entre os vetores u = (a,,a,, ..,a))ev = (b,, bz, ..., b,) de R” é denotada e definida por 


d(u,v) = j= mb) +) + +(a,— bo) 


SA ge us E = Mr é aê 2 

Pode ser mostrado que essa definição está de acordo com a noção usual de distância no plano euclidiano Rº ou 
3 

no espaço R`. 
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O ângulo 0 entre dois vetores não nulos u e v de R” é definido por 


uu 
cos 0 = 


lulilo] 


O ângulo está bem definido porque, pela desigualdade de Schwartz (Teorema 1.3), 


é uu el 
lulilo 


Observe que se u - v = 0, então 0 = 90º (ou 0 = 7/2). Isso está de acordo com nossa definição anterior de ortogo- 
nalidade. 
A projeção de um vetor u sobre um vetor não nulo v é denotada e definida por 
uu uu 


proj(u, v) = v= v 
lloll Man 


Veremos adiante que essa definição está de acordo com a noção usual de projeção da Física. 


Exemplo 1.5 
(a) Suponha que u = (1,-2,3) ev = (2, 4, 5). Então 


d(u, v) = y (1-2? + (-2-4} +6- 5} = VIF 36F4= Vai 


Para encontrar cos 0, onde 0 é o ângulo entre u e v, primeiro determinamos 


u-v=2-8+15=9, lul? =1+4+9= 14, lul? =4+16+25 = 45 
Então 

cos 0 = e a 

lulilo 1445 
Também 
uu 9 1 24 
j = = (2,4,5) == (2,4,5)= ( 2,=,1 
profa, 0) = Erv = 045) =5(2,4,8) = (551) 


(b) Considere os vetores u e v dados na Figura 1-2(a) (com respectivos pontos finais em A e B). A projeção (per- 
pendicular) de u sobre v é o vetor u* de norma 


u= Y uu 


Iu*| = Ilul| cos O = Ijul 


lulloll loll 


P(b;-a;, bya, by-as) 
B(b,, bz, ba) 
u A(ar, do, 43) 
0 q 
y 
x 
Projeção u*de u sobre v u=B-A 


(a) (b) 


Figura 1-2 
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Para obter u*, multiplicamos sua norma pelo vetor unitário na direção e sentido de v, obtendo 


v uv v uu 


= = v 
lol ol ol ol? 


u* = ||u*|| 
Esse valor coincide com o dado na definição de proj(u, v). 


1.5 VETORES APLICADOS, HIPERPLANOS, RETAS E CURVAS EM R” 


Nesta seção fazemos uma distinção entre a ênupla P(a,) = P(a,,a,,...,a,) vista como um ponto de R” e a ênupla 
u = [c,,C,,..., C,] vista como uma seta (vetor) da origem O até o ponto C(c,, Cz, ..., Cp). 


Vetores aplicados 
Qualquer par de pontos 4 (a;) e B(b;) de R” define um vetor aplicado ou um segmento de reta orientado de A para 
B, denotado por AB. Identificamos o vetor AB com o vetor 

u=B-A= b, — dy, b, — a, TER b, — à,] 


porque AB e u têm a mesma norma e a mesma direção. Isso está ilustrado na Figura 1-2(b) para os pontos 
A(a,, a, a;) e B(b,, b,, b;) de R? e o vetor u = B — A de ponto final P(b, = à, Db; — AD; = à). 


Hiperplanos 
Um hiperplano H em R” é o conjunto de pontos (x,, xX», ..., x,) que satisfazem uma equação linear 
aX + aX + + ap Xn =b 
em que o vetor de coeficientes u = [a,, a,, ...,a,) não é nulo. Assim, um hiperplano H em Rº é uma reta e um hiper- 
plano H em R° é um plano. Mostraremos adiante que, conforme mostrado na Figura 1-3(a) para o R’ ué ortogonal 


a qualquer segmento de reta orientado PQ, em que P(p,) e O(g;) são pontos de H. [Por essa razão, dizemos que u é 
normal a H e que H é normal a u.] 


(b) 


(a) 
Figura 1-3 


Como P(p;) e O(q,) pertencem a H, esses pontos satisfazem a equação do hiperplano, ou seja, 


aptop+r+tap=>b e aqi + arqa +`: + angr =b 


=} 
Seja v = PO = Q -P = [q1 - Pi; q2 — P2,- - -34n — Pr] 
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Então 


u: v =a (qi —pi)+ago— po) ++ anlan — Ph) 
= (aqi + aqa +5: + angna) — (a1 Pi +a Pa +: +H appn) =b- bI 


—> 
Assim, v = PQ é ortogonal a u, como afirmado. 


Retas em R” 


A reta L de R” que passa pelo ponto P(b,, b,, ..., b,) na direção e sentido do vetor não nulo u = [a,, a», ..., a,] CON- 
siste nos pontos X(x,, X,, ..., X,) que satisfazem 
X = at im bi 
X, = at + b 
X=P+tu ou AEk a ou L(t) = (a;jt + bi) 


em que o parâmetro t percorre todos os valores reais. Uma tal reta L de R? aparece na Figura 1-3(b). 


Exemplo 1.6 


(a) Seja H o plano de R? que corresponde à equação linear 2x — 5y + 7z = 4. Observe que P(1, 1, 1) e Q(5, 4, 2) 
são soluções dessa equação. Assim, P e Q, bem como o segmento de reta orientado 


v=P0=0-P=[5-1,4-1,2-1=[4,3,1] 


estão no plano H. O vetor u = [2, —5, 7] é normal a H e, como era de se esperar, 
u- v= |2, -—5,7] - [4,3,1] =8- 15+7=0 
Portanto, u é ortogonal a v. 


(b) Encontre uma equação do hiperplano H de Ri que passa pelo ponto P(1, 3, —4, 2) e é normal ao vetor v = [4, 
-2, 5, 6]. 
Os coeficientes das incógnitas na equação de H são os componentes do vetor normal u, portanto, a equa- 
ção de H deve ser da forma 


4x, — 2x, + 5x3 + 6x4 = k 


Substituindo P nessa equação, obtemos 


4(1) = 23) +5(—4) +6(2)=k ou 4-6-20+12=k ou k=-10 


Assim, a equação de H é dada por 4x, — 2x, + 5x3 + 6x4 = —10. 


Encontre a representação paramétrica da reta L de Rº que passa pelo ponto P(1, 2, 3, 4) e que tem a direção 
e o sentido de u = [5, 6, —7, 8]. Encontre, também, o ponto Q de L dado por t = 1. 

Substituindo os componentes de P e u nos componentes da equação paramétrica geral dada, obtemos a 
representação paramétrica a seguir. 


(c 


< 


x =5+1, x =6+2, x ==- +3, x,=8t-—4 


ou, equivalentemente, 


L(t) = (5t + 1,6t +2, —7t + 3, 8t — 4) 


Observe que usando t = O obtemos o ponto P de L. A substituição t = 1 fornece o ponto Q(6, 8, —4, 4) de L. 


Curvas em R” 


Seja D um intervalo (finito ou não) da reta real R. Uma função contínua F: D — R” é uma curva de R”. Assim, a 
cada ponto t € D está associado o ponto 


FO = LED, FRO, FD] 
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de [R”]. Além disso, a derivada de F(t), se existir, fornece o vetor 


o dF(t) E dF, (t) dF,(t) dF,(t) 


V(t sê 
(9) dt d >° d TC dt 


que é tangente à curva. Normalizando V(t), obtemos 


Assim, T(t) é um vetor tangente unitário à curva. (Vetores unitários com significado geométrico costumam ser 
denotados em negrito.) 


Exemplo 1.7 Considere a curva F(t) = [sen t, cos t, t] de R°. Tomando a derivada de F (t) [ou, de cada componen- 
te de F(t)], obtemos 


V(t) = [cos t, -sen t, 1] 


que é um vetor tangente à curva. Normalizemos V(t). Inicialmente obtemos 


IVA]? = cos? t +sen?t+1=1+1=2 


Decorre que o vetor tangente unitário T(t) dessa curva é dado por 


T(t) 


_ V) ey — sent A 
IOI 1v2? v2 'v2 


1.6 VETORES DE Rº (VETORES ESPACIAIS), NOTAÇÃO ijk 


3 . E . . o . p o . 
Os vetores de R`, denominados vetores espaciais, ocorrem em muitas aplicações, especialmente na Física. Existe 
até uma notação especial para três desses vetores, como segue. 


[1,0, 0] denota o vetor unitário na direção e sentido de x positivo. 
j = [0, 1,0] denota o vetor unitário na direção e sentido de y positivo. 
k = [1,0, 1] denota o vetor unitário na direção e sentido de z positivo. 


Então cada vetor u = [a, b, c] de R? pode ser escrito de maneira única no formato 
u = [a, b, c] = ai + bj + ck 

Como os vetores i, j e k são unitários e mutuamente ortogonais, obtemos os produtos escalares seguintes. 
li=), j-j=1, k-k=1 e i-j=0, ik=0, j-k=0 


Além disso, as operações vetoriais apresentadas anteriormente podem ser dadas em termos da notação ijk como 
segue. Suponha que 


u = qi + aj + azk e v = bii + baj + bk 
Então 

u + v= (a; + b)i + (a, + bo)j + (as + ba)k e ru = raji + raj + rask 
onde r é um escalar. Também 


u- v = a;b; + ab, + a3b3 e lul = vu -u = d + +é 


Exemplo 1.8 Suponha que u = 3i + 5j — 2k e v = 4i — 8j + 7k. 


(a) Para encontrar u + v, somamos componentes, obtendo u + v = 7i — 3j + 5k 
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(b) Para encontrar 3u — 2v, multiplicamos primeiro pelos escalares e depois somamos. 


3u — 2v = (9i + 13] — 6k) + (—8i + 16] — 14k) = i + 29j — 20k 


(c) Para encontrar u - v, multiplicamos os componentes correspondentes e depois somamos. 
u: v = 12 — 40 — 14 = 42 


(d) Para encontrar ||u]|, tomamos a raiz quadrada da soma dos quadrados dos componentes. 


lull = V9 +25 +4 = v38 


Produto vetorial 


. ee . 3 e E o. ~ 2 
Existe uma operação especial envolvendo vetores de R” que não está definida em R”, com n Æ 3. Essa operação é 
denominada produto vetorial e é denotada por u x v. Uma maneira de lembrar facilmente da fórmula para o cálcu- 
lo deu x v é usar o determinante (de ordem dois) e seu simétrico, que são denotados e definidos como segue. 


a b a b 
c d c d 


|= ad-e e — 


|=te-ad 


Aqui, dizemos que a e d são os elementos da diagonal e b e c os elementos da diagonal oposta. Assim, o determi- 
nante é o produto ad dos elementos da diagonal menos o produto bc dos elementos da diagonal oposta, mas é o 
simétrico disso para o simétrico do determinante. 

Supondo que u = qi + a,j + ak e v = bi + b,j + bk,temos 

u x v = (ab; — azb,)i + (ab; — a;b3)j + (aib — abı )k 
M a2 B 
bj b b; 


q a as 
bi b b; 


a ù 3 
bi b b 


i— 


j+ 


Ou seja, os três componentes de u x v são obtidos da tabela 


(que contém, na primeira linha, os componentes de u e, na segunda, os de v) como segue. 


(1) Oculte a primeira coluna e calcule o determinante. 
(2) Oculte a segunda coluna e calcule o simétrico do determinante. 
(3) Oculte a terceira coluna e calcule o determinante. 


Observe que u x v é um vetor, o que justifica a denominação de produto vetorial. 


Exemplo 1.9 Encontre u x v nos casos seguintes. (a) u = 4i +3j)+6k,v=2i+5)-—-3k;(bD)u=l[2,-1,5], 


v=[3,7,6]. 
4 3 6 r ; ; ; 
(a) Usamos 2 5 3 |Para obteru x v = (—9 — 30)i + (12 + 12)j + (20 — 6)k = —39i + 24j + 14k. 
2 =l 5 
(b) Usamos | 3 7 6 |paraobterux v = [-6 — 35,15 — 12,14 + 3] = [-41,3,17)] 
OBSERVAÇÃO O produto vetorial dos vetores i, j e k são os seguintes. 
ixj=k, jxk=i, kxi=j 
jxi= —k, k xj= -i, ixk= -j 


Assim, se interpretarmos o terno (i, j, k) como uma permutação cíclica, em que i segue k e, portanto, k antecede i, 
então o produto vetorial de dois deles no sentido dado é o terceiro, mas o produto vetorial de dois deles no sentido 
oposto é o simétrico do terceiro. 


Duas propriedades importantes do produto vetorial estão destacadas no próximo teorema. 
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Volume = uv X w Plano complexo 


(a) (b) 


Figura 1-4 


Teorema 1.5 Sejam u, ve w vetores de R°. 
(a) O vetor u x v é ortogonal a ambos, u e v. 
(b) O valor absoluto do “produto triplo” 


Uu: UXW 


representa o volume do paralelepípedo formado pelos vetores u, v e w. [Ver Figura 1-4(a).] 


Observamos que os vetores u, veu x v formam um sistema orientado de mão direita e vale a fórmula seguinte 
para o módulo de u x v, 


llu x v]] = llulil[v]| senô 


onde 0 é o ângulo entre u e v. 


1.7 NÚMEROS COMPLEXOS 


O conjunto dos números complexos é denotado por C. Formalmente, um número complexo é um par ordenado (a, 
b) de números reais, sendo a igualdade, a adição e a multiplicação desses pares definidas como segue. 


(a,b) = (c,d) se,esóse, a=c e b=d 
(a,b) + (c,d) = (a+c, b+ d) 
(a,b) - (c,d) = (ac — bd, ad + bc) 

Identificamos o número real a com o complexo (a, 0), ou seja, 

a +> (a,0) 
Isso é possível porque as operações de adição e multiplicação de números reais são preservadas por essa correspon- 
dência, isto é, 

(a,0) + (b,0) = (a +b, 0) e (a,0) - (b,0) = (ab, 0) 
Assim, vemos R como um subconjunto de C e substituímos (a, 0) por a sempre que for conveniente e possível. 

Observamos que o conjunto C dos números complexos, dotado das operações de adição e multiplicação assim 


definidas, constitui um corpo numérico, da mesma forma que o conjunto R dos números reais e o conjunto Q dos 
números racionais. 
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O número complexo (0, 1) é denotado por i. Esse número tem a importante propriedade de que 
P = i = (0,1)(0,1) = (-1,0)=-1 ou i=V- 


Dessa forma, qualquer número complexo z = (a, b) pode ser escrito da forma 
z = (a,b) = (a,0) + (0, b) = (a,0) + (b,0) - (0,1) =a + bi 


Essa notação z = a + bi, em quea = Re z e b = Im z são denominadas, respectivamente, a parte real e a par- 
te imaginária de z, é mais conveniente do que a de par ordenado (a, b). Isso se deve ao fato de que a soma e o 
produto dos números complexos z = a + bi e w = c + di podem ser efetuados simplesmente usando a comutativi- 
dade e a distributividade e lembrando que ? = —1, como segue. 


z+w = (a+ bi) + (c+ di) =a+c+bi+di= (a+b)+(c+d)i 
zw = (a + bi)(c + di) = ac + bci + adi + bd? = (ac — bd) + (bc + ad)i 


Também definimos o simétrico de z e a subtração em C por 
-z = -lz e w>—z=w+ (=z) 


Atenção: A letra i que representa V —1 não tem relação alguma com o vetor i = [1, 0, 0] da Seção 1.6. 


Conjugado complexo, valor absoluto 


Considere o número complexo z = a + bi. O conjugado de z é denotado e definido por 


Z=a+bi =a -— bi 


Então zZ = (a + bi)(a — bi) = a? — bi = a? + b’. Observe que z é real se, e só se, Z = Z. 
O valor absoluto de z, denotado por |z|, é definido como a raiz quadrada não negativa de zZ, ou seja, por 


Iz| = VzZ = vV &@ + b? 
Observe que |z| é igual à norma do vetor (a, b) de R°. 
Suponha que z Æ 0. Então o inverso z™! de z e a divisão em C de w por z são definidos, respectivamente, por 
4 Z a b w wz 4 


Z == i e — = WZ 
z &@ +b &@ +b? zZz zZ 


Exemplo 1.10 Suponha que z = 2 + 3i e w = 5 — 2i. Então 

z+tw=(2+3)+(5-2)=24+5+4+3i-2;=7+i 
zw = (2 + 3i)(5 — 2i) = 10 + 15i — 4i — 6 = 16+1li 
2+3i=2-3i e w=5-2i=5+2i 
5-2 (5-2)(2-3i) 4-19% 4 19. 
2 


E pino G B B 


lz| = V4 +9 = V13 e |w| = V25 +4 = v29 


Plano complexo 


O conjunto R dos números reais pode ser representado pelos pontos de uma reta. Analogamente, o conjunto C dos 
números complexos pode ser representado pelos pontos de um plano. Mais precisamente, consideramos que o 
ponto (a, b) do plano representa o número complexo z = a + bi, conforme Figura 1-4 (b). Nesse caso, |z| é a dis- 
tância da origem O do plano ao ponto z. O plano com essa representação é denominado plano complexo, assim 
como a reta que representa R é denominada reta real. 
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1.8 VETORES DE C” 


O conjunto de todas as ênuplas de números complexos, denotado por C”, é denominado espaço n-dimensional 
complexo. Assim como no caso real, os elementos de C” são denominados pontos ou vetores, os elementos de C 
são os escalares e a soma de vetores em C” e a multiplicação por escalar em C” são dadas por 


[2142230520] + [Wis W2; <- -3 Wn] = E; +w, Z, + Wo; owy Zn + Wn] 
2 mc = ZZi; ZZ; a] 


com Z, w, e zem C. 


Exemplo 1.11 Considere os vetores u = [2 + 3i, 4 — i, 3] ev = [3 — 2i, 5i, 4 — 6i] de C?. Então 
u+v = 2+3i, 4—i, 3]+[3-—2i, 5i, 4— 6i) = [5+i, 4+4i, 7-— 6i] 
(5—2iju = [(5— 2i)(2 + 3i), (5— 2i)(4— i), (5— 2i)(3)] = [16+ 1li, 18 — 13i,15 — 6 i] 


Produto escalar (ou interno) em C” 


Considere os vetores u = [z}, Z» ....Z]ev= [w], W» ..., w,] em C”. O produto escalar, ou produto interno, de u e 
v é denotado e definido por 


U: U = ZiWi +2W + ++ + Zp Wn 


Essa definição reduz ao caso real, pois Wg = wg quando w, for real. A norma de u é definida por 


- = = 2 2 2 
lul| = Vu: u = 4/2121 +20 + + Zp = yel + af ++ zal 
Reforçamos que u - u e, portanto, ||u|| são reais e positivos quando u O e iguais a O quando u = 0. 


Exemplo 1.12 Considere os vetores u = [2 + 3i, 4 — i, 3 + 5i] ev = [3 — 4i, 5i, 4 — 2i] de C’. Então 


u- v = (2 + 3i)(3 = 4i) + (4 — D (5i) + (3 + 5) (4 = 2i) 
= (2 + 3i) (3 + 4i) + (4 — i) (—5i) + (3 + 5i) (4 + 2i) 
= (—6 + 13i) + (—5 — 20i) + (2 + 26i) = —9 + 19i 


u-u = |2 +3i? +4- i? +3 +5i? = 4+9+16+1+9+25 = 64 
lul] = v64 = 8 
O espaço C”, com as operações dadas de soma de vetores, multiplicação por escalar e produto interno, é deno- 


minado espaço euclidiano n-dimensional complexo. O Teorema 1.2 dado para R” também é válido em C”, bastando 
substituir u + v = v ; u por 


U- VSU: v 


Além disso, as desigualdades de Schwarz (Teorema 1.3) e de Minkowski (Teorema 1.4) são verdadeiras em C” sem 
alteração alguma. 


Problemas Resolvidos 


Vetores de R” 


1.1 Decida quais vetores dentre os dados são iguais. 
u, = (1, 2, 3), u, = (2,3, 1), u, = (1, 3, 2), u, = (2,3, 1) 


Dois vetores são iguais se suas entradas correspondentes forem iguais; logo, só u, = u4. 
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1.2 Sejam u = (2,-7, 1), v = (-3,0,4)ew = (0,5, —8). Encontre 
(a) 3u — 4v, 
(b) 2u + 3v — 5w. 


Primeiro multiplicamos pelos escalares e só depois efetuamos a soma dos vetores. 
(a) 3u -— 4v = 3(2, —7, 1) — 4(-3,0,4) = (6, —21,3) + (12,0, —16) = (18, —21, —13) 
(b) 2u + 3v -— 5w = (4, —14,2) + (—9,0, 12) + (0, —25, 40) = (—5, —39, 54) 


5 —1 3 
1.3 Sejamu = 3|,v= 5 lew= | —l | Encontre 
-4 2 -3 


(a) Su — 2v, 
(b) -2u + 4v — 3w. 


Primeiro multiplicamos pelos escalares e só depois efetuamos a soma dos vetores. 


5 —1 25 2 27 
(a) Su-20=5| 3] -2| 5|= 15| + |-10|] = 5 
—4 2 —20 —4 —24 
—10 —4 —9 —23 
(b) —2u + 4v — 3w = 6| +] 20| + 3] = 17 
8 8 6 22 


1.4 Encontre x e y tais que valham as igualdades: (a) (x, 3) = (2, x + y), (b) (4, y) = x(2, 3). 
(a) Como os vetores são iguais, igualamos seus componentes correspondentes, obtendo 
x=2, 3=x+y 


Resolvendo as equações lineares, obtemos x = 2, y =1. 
(b) Multiplicando pelo escalar x obtemos (4, y) = (2x, 3x). Igualando as entradas correspondentes, obtemos 


4 = 2x, y= 3x 


Resolvendo as equações, obtemos x = 2, y =6. 


1.5 Escreva o vetor v = (1, —2, 5) como uma combinação linear dos vetores u, = (1, 1, 1), u, = (1, 2, 3) e u, = 
(2,-1, 1). 


Queremos escrever v no formato v = xu + yu, + Zuz, com x, y e z ainda desconhecidos. Inicialmente, temos 


1 1 1 2 x+ y+2z 
—2 | =x| 1| +y|2| +z|—-1| = |x+2y- z 
5 1 3 1 x+3y+ z 


(E mais conveniente escrever vetores como colunas, e não como linhas, quando formamos combinações lineares.) Igua- 
lando as entradas correspondentes, obtemos 


x+ y+2= 1 x+ y+2z= 1 x+y+2z= 1 
x+2y— z= -2 ou y-— 3z = —3 ou y-— 3z = —3 
x+3y+ z= 5 2y— z= 4 5z = 10 


A única solução desse sistema triangular é x = —6, y = 3 e z = 2. Assim, v = —6u, + 3u, + 2u,. 
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1.6 Escreva v = (2, -5, 3) como uma combinação linear de 


u, = (1, 3, 2), u, = (2, —4, —1) e u, = (1, 5, 7). 


Obtenha o sistema de equações lineares equivalente e resolva. Temos 


2 1 2 1 x+2y+ z 
5| =x| -3| +y +z 3x — 4y — 5z 
3 2 —1 7 2x— y+7z 


x+2y+ z= 2 x+2y+ z= 2 x+2y+ z=2 
3x — 4y — 5z = —5 ou 2y — 2z = ou 2y — 2z = 
2xx— y+7z= 3 =5y+5z=-1 0=3 


A terceira equação Ox + Oy + Oz = 3 indica que esse sistema não tem solução. Assim, v não pode ser escrito como uma 
combinação linear dos vetores u,, U, € u}. 


Produto escalar (interno), ortogonalidade, norma em R” 


1.7 Obtenha u - v, sendo 
(a) u=(2,-5,6)ev=(8,2,-3), 
(b) u=(4,2,-3,5,-D)ev=(2,6,-1,-4,8). 
Multiplicamos os componentes correspondentes e somamos. 
(a) u- v= 2(8) — 5(2) + 6(—3) = 16 — 10 — 18 = —12 
(b) u: v= 8 +12 +3- 20-8 = —5 


1.8 Sejam u = (5, 4, 1), v = (3, —4, 1) e w = (1,-2, 3). Quais pares desses vetores (se houver) são perpendicu- 
lares (ortogonais)? 


Calculamos o produto escalar de cada par de vetores. 
uv=15-16+1=0, vw=3+8+3=14, uw=5-8+3=0 


Assim, u e v são ortogonais, u e w são ortogonais, mas v e w não são. 


1.9 Obtenha k tal que u e v sejam ortogonais, nos casos seguintes. 
(a) u=(1,k,-3)ev = (2,-5,4), 
(b) u = (2, 3k, —4, 1, 5) e v = (6, —1, 3, 7, 2k). 
Calculamos u - v, igualamos a zero e resolvemos em k. 
(a) u-v = 1(2) + k(—5) — 3(4) = —5k — 10. Então —5k — 10 = 0, ou k = -2. 
(b) u-v = 12 — 3k — 12 +7 + 10k = 7k + 7. Então 7k + 7 = 0, 0u k = -1. 


1.10 Encontre ||uļ|, nos casos (a) u = (3,-12,-4), (b) u = (2, -3, 8, —7). 
Primeiro calculamos ||u||? = u - u, somando o quadrado das entradas do vetor. Então ||ul| = 4/ llull’. 
(a) lull? = (32 + (127? + (14? = 9 + 144 + 16 = 169. Então |ju|| = V169 = 13. 
(b) Ilul? = 4+9 + 64+ 49 = 126. Então ||ul| = 126. 
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1.11 


1.12 


1.13 


Lembre que normalizar um vetor não nulo significa encontrar o único vetor unitário à com mesma direção 
e sentido que v, dado por 


1 
— v 
loll 


Normalize (a) u = (3, —4), (b) u = (4,-2,-3, 8), (© w = (E 3, — D. 


D = 


(a) Primeiro calculamos ||u|| = 4/9 + 16 = v25 = 5. Então dividimos cada entrada de u por 5, obtendo à = (5, — $). 
(b) Temos||v|| = 16 +4 +9 + 64 = V93. Logo, 


E ( 4 -2 -3 8 ) 
U= 3 7 ? 
v93 V93 V93 V93 
(c) Observe que w, e qualquer múltiplo positivo de w, terão a mesma normalização. Portanto, primeiro multiplicamos 
w por 12 para eliminar as frações, ou seja, primeiro calculamos w' = 12w = (6, 8, —3). Então 


~ 6 8 —3 
w||=v36+64+9=V109 e w= = , f ) 
Iw v 109 109 4109 
Sejam u = (1, —3, 4) e v = (3,4, 7). Encontre 
(a) 0, onde 0 é o ângulo entre u e v; 
(b) a projeção proj(u, v) de u sobre v; 
(c) a distância d(u, v) entre u e v. 


Primeiro calculamos u - v = 3 — 12 +28 = 19, |u/=1+9+16=26, Iv? = 9+ 16+ 49 = 74. Então 
v 19 


u . 
Iullloll 2674" 


(b) proj(u, v) = ri E dio Z 76 2) z (5 38 e). 
v 


(a) cos0 = 


“74 74" 74" 74 74°37 74 
(©) d(u,v) = |lu — ol] = |(-2,-7 —3)] = V4+49+9 = v62. 


Demonstre o Teorema 1.2. Dados quaisquer u, v e w em R” e rem R, 
G) (u+v)-w=u-w+v:w, (ü) (ru): v= r(u- v), Gii) u-v=v-u, 
Gv) u -u > Qeu -u = Q se, e só se, u = 0. 


Sejam u = (uj, Uz, ..., Up), U = (Ui, Vas ce, Up) E W = (Wis Wos cce Wp). 


n 


G) Comou + v= (u; +01, U +, ..., Un + Vn) 
(u+ v) w= (u +v)w + (u + v)w +-+- + (un + Yp )Wy 
= UW + VW, + UW + EUM F UW, 
= (mw, +uw + `+: F Up Wp) + (VW + UW + + Upwa) 


=uUw+v-w 
(ii) Como ru = (ruj, Fuz, ..., Fun) 


(ru) - v = Fu Y + rU +: HrU, U, = F(U U H Ut +: H up) = r (u v) 


Gii) u- V = UV + Ut +: tuv= VU + Vta +: H VU 


nUn S VU 


(iv) Como u, é não negativo, para cada k, e como a soma de números não negativos é não negativa, 
= ++ -+ >Ô 


Além disso, u -u = O se, e só se, u, = O, para cada k, ou seja, se, e só se, u = 0. 


CaríruLo 1 ° VETORES EM R” E C”, VETORES ESPACIAIS —— «FP 


1.14 Demonstre o Teorema 1.3 (Schwarz). |u - v| < |jul||/vl). 


Dado qualquer número real t, o Teorema 1.2 garante que 
O<(tu+ro)-(u+r)=P(uu+2(uv)+(v-0)= llul? Ê +2(u- v)t + ol? 
Sejam a = ||ul|?, b = 2(u- v)ec = ||vl|?. Então, para cada valor de t, temos af? + bt + c > 0. Isso significa que esse 


polinômio de segundo grau não pode ter duas raízes reais. Disso decorre que o discriminante D = b? — 4ac < 0 ou, 
equivalentemente, que b? < 4ac. Assim, 


2 2h. j2 
uv) < Alul loll 
Resta dividir por 4 para obter nosso resultado. 


1.15 Demonstre o Teorema 1.4 (Minkowski). ||u + v|| < IJul| + Ilol]. 


Pela desigualdade de Schwarz e outras propriedades do produto escalar, temos 


lu + v? = (u+ v) + (u + v) = (u-u) + 2(u : v) + (v: v) < Jul? + 2lullloll + lel? = (ell + lol? 


Tirando a raiz quadrada de ambos lados, obtemos a desigualdade procurada. 


Pontos, retas e hiperplanos em R” 


Nesta parte vamos distinguir entre uma ênupla P(a,, a,, ..., a,), considerada como sendo um ponto de R”, e uma 
ênupla u = [c,, c,, ..., c,), considerada como sendo um vetor (segmento orientado) desde a origem O até o ponto 
Clia Cj on). 


1.16 Encontre o vetor u identificado com o segmento de reta orientado PO para os pontos 
(a) P(1,-2, 4) e Q(6, 1,-5) em Rº, (b) P(2, 3, -6,5) e Q(7, 1,4,-8) em Rº. 
(a) u=P0=0 P=[6-=1,1=(-2), -5 — 4] = [5,3,—9] 
(b) u= PO =0-P=[7-2, 1-3, 4+6, —8 — 5] = [5, —2, 10, —13] 


1.17 Encontre uma equação do hiperplano H de Rº que passa por P(3, —4, 1, —2) e é normal a u = [2,5,-6,-3]. 


Os coeficientes das incógnitas na equação de H são os componentes do vetor normal u. Assim, uma equação de H 
é da forma 2x, + 5x, — 6x3 — 3x4 = k. Substituindo P nessa equação, obtemos k = 1. Então uma equação de H é 
2x1 - 5x, 6x3 3x4 — 26. 


1.18 Encontre uma equação do plano H de R? que contém o ponto P(1, —3, —4) e é paralelo ao plano H’ determi- 
nado pela equação 3x — 6y + 5z = 2. 


Os planos H e H' são paralelos se, e só se, suas direções normais são paralelas, com mesmo sentido ou sentidos opos- 
tos. Logo, uma equação de H é do tipo 3x — 6y + 5z = k. Substituindo P nessa equação, obtemos k = 1. Então, uma 
equação de H é 3x — 6y + 5z = 1. 


1.19 Encontre uma representação paramétrica da reta L de Rº que passa por P(4, —-2, 3, 1) na direção de 
u=[2,5,-7,8]. 


Aqui, L consiste nos pontos X(x,) que satisfazem 
X=P+iu, ou x=at+b, o M)=(at+b), 


em que o parâmetro t percorre todos os reais. Então, obtemos 


x=4+2t, w=-2+2t, x =3— 7t, x=1+8t o L0)=(4+2, —2+24,3-M%, 1+8t) 
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1.20 Seja C a curva dada por F(t) = (P, 3t — 2, Č, Ê +5)deR',com0O<1<4 
(a) Encontre o ponto P de C que corresponde a t = 2. 
(b) Encontre o ponto inicial Q de C e seu ponto final Q’. 
(c) Encontre o vetor tangente unitário T à curva C com t = 2. 
(a) Substituindo t = 2 em F(t), obtemos P = F(2) = (4, 4, 8, 9). 
(b) O parâmetro t varia de t = 0 até t = 4. Portanto, Q = F(0) = (0, -2, 0, 5)e Q’ = F (4) = (16, 10, 64,21). 


(c) Tomando a derivada de F(t), ou seja, de cada componente de F(t), obtemos um vetor V que é tangente à curva. 


V(t) = atu = [2t,3, 3, 2t] 


Agora, calculamos V com t = 2, ou seja, substituímos t = 2 na equação de V(t) para obter V = V(2) = [4, 3, 12,4]. 
Em seguida, normalizamos V para obter o vetor tangente unitário T requerido. Temos 


N E. 3 12 4 
V185' 185' V185 V185 


IV] = v16 +9 + 144+ 16 = v185 e 


Vetores espaciais (de R°), notação ijk, produto vetorial 


1.21 Sejam u = 2i — 3j + 4k, v = 3i + j — 2k e w = i + 5j + 3k. Encontre 
(a) u +v, (b) 2u-— 3v + 4w, (c) u-v e u:w, (d) lull e ol). 
Tratamos os coeficientes de i, j e k como se fossem componentes de um vetor de R°. 
(a) Somamos os coeficientes correspondentes para obter u + v = 5i — 2j — 2k. 


(b) Primeiro multiplicamos por escalar e depois somamos os vetores. 


2u — 3v + 4w = (4i — 6j + 8k) + (—9i + 3j + 6k) + (4i + 20j + 12k) 
—i + 17j + 26k 


(c) Multiplicamos os coeficientes correspondentes e depois somamos. 


uv=6-3-8=-—5 e uw=2-15+12=-—1 


(d) A norma é a raiz quadrada da soma dos quadrados dos coeficientes. 


lul=v4+9+16=v29 œ lull = V9 + 1+4 = v14 


1.22 Encontre equações paramétricas da reta L que 
(a) passa pelos pontos P(1, 3, 2) e Q(2, 5, —6); 
(b) contém o ponto P(1, —2, 4) e é perpendicular ao plano H de equação 3x + 5y + 7z = 15. 
(a) Inicialmente obtemos v = PO =0-P=[1,2,-8]=i+2j-— 8k. Então 


L(t) = (t+1, 2t+3, —8t + 2) = (t+ 1)i+ (2t + 3)j + (—8t + 2)k 


(b) Como L é perpendicular a H, a reta L tem a mesma direção do vetor normal N = 3i + 5j + 7k ao plano H. Assim, 


L(t) = (3t+ 1, 5t—2, 7t +4) = (3t + 1)i + (St — 2)j + (7t + 4)k 


1.23 Seja S a superfície de equação xy” + 2yz = 16 em R°. 
(a) Encontre o vetor normal N(x, y, z) à superfície S. 


(b) Encontre o plano tangente H à superfície S no ponto P(1, 2, 3). 
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(a) A fórmula do vetor normal a uma superfície dada por F(x, y, z) = 0 é 
N(x, y, z) E Fã +A j + F,k 
onde F,, F, e F, são as derivadas parciais de F. Usando F(x, y, z) = xy + 2yz — 16, obtemos 


F =7, F, = 2xy + 2z, F, =2y 


Assim, N(x, y, z) = y'i + (xy +2z)j + 2yk. 


(b) O vetor normal à superfície S no ponto P é 
N(P) = N(1,2,3) = 4i + 10j + 4k 


Logo, N = 2i + 5j + 2k também é normal a § em P. Portanto, uma equação de H tem a forma 2x + 5y + 2z = c. 
Substituindo P nessa equação, obtemos c = 18. Assim, o plano tangente H a S em P é dado por 2x + 5y + 2z = 18. 


1.24 Calcule os determinantes e os simétricos de determinantes de ordem dois seguintes. 


nI3 4 a I2 — en 4 —5 
O alal 3) ain [5 
; 3 6 és 7 —5 Gk 4 -l1 
(b) © | 4 2 > i) | 3 2 > (iii) | 8 —3 
Usamos é à mad e — E 4 | = be — ad. Assim, 
c-a e d 


(a) ()27-20=7, (11) 6+4= 10, (iii) -8 +15 =7. 
(b) (i) 24-6= 18, (ii) -15- 14 = —29, (iii) —8 + 12 = 4. 


1.25 Sejam u = 2i — 3j + 4k, v = 3i + j — 2k e w = i + 5j + 3k. Encontre (a) u x v, (b) uxw 


2 =3 4 
(a) Usamos| 3 | 3 para obter u x v = (6 — 4)i + (12 + 4)j + (2 + 9)k = 2i + 16j + 11k. 


(b) Usamos 


2 -3 4 
1 5 à [para obieru x w= (9-20 + (4 6)j + (10 + 3)k = —29i — 2j + 13k. 


1.26 Encontre u x v, sendo (a) u = (1, 2, 3), v = (4, 5, 6); (b) u = (—4, 7, 3), v = (6, —5, 2). 


(a) Usamos 


l-2 3 
4 5 é [para obteru x v= [12 15, 12- 6, 5- 8] = [-3, 6, —3]. 


(b) Usamos 4 “5 3 [para obter u x v= [14+ 15, 18 +8, 20 — 42] = [29,26, —22]. 


1.27 Encontre um vetor unitário u ortogonal a v = [1, 3, 4] e w = [2,-6, —5]. 


Primeiro calculamos v x w, que é ortogonal a v e a w. 


2 —6 
Agora normalizamos v x w para obter u = [9/v394, 13/394, —12/394]. 


A tabela» 5 Sfrosdéuxw=| 15 +24, 8+5, —6 — 61] = [9, 13, —12]. 


1.28 Dados u = (a,, dz, as) ev = (b, b,, b;), temos u xX v = (azb; e azb, azb; = a;b, a;b, = ab). Prove 
que 


(a) u x v é ortogonal a u e a v [Teorema 1.5(a)]. 


(b) |u x v||? = (u - u)(v - v) — (u - v} (Identidade de Lagrange). 
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(a) Temos 
u: (u x v) = a, (a,b; — a3b2) + a (azb; — abs) + a3 (aib, — ab: ) 
= aab; n a;azb, + aab; = aab; + ajazb, = aazbı =0 
Assim, u X v é ortogonal a u. Analogamente, u x v é ortogonal a v. 


(b) Temos 


|lu x ul = (ab; azb)? + (azb; abs + (aib abr) (1) 
(ua)(v v) — (u-v? =(d+rad+a)(b + b2 + b2) — (aibi + ab + ab; (2) 


Expandindo o lado direito das igualdades (1) e (2), estabelecemos a identidade. 


Números complexos, vetores de C” 


1.29 Suponha que z = 5 + 3i e w = 2 — 4i. Encontre (a) z + w, (b) z — w, (c) zw. 
Usamos as regras algébricas usuais, junto com É = —1, para obter os resultados no formato padrão a + bi. 
(a) z+w = (5 + 3i) + (2 — 4i) =7 — i 
(b) z— w = (5 + 3i) — (2 — 4i) = 5 + 3i — 2 + 4i = 3 + 7i 
(c) zw = (5 + 3i)(2 — 4i) = 10 — 14i — 12 = 10 — 14i + 12 = 22 — 14i 


1.30 Simplifique (a) (5+3i)(2—7i), ©) (4-3P,(0) (1429. 
(a) (5 +3i(2— 7i) = 10 + 6i — 35i — 21? = 31 — 29i 
(b) (4 = 3i} = 16 — 24i + 9P =7 — 24i 
(o) (1+2)? = 1+ 6i +122 +82 =1+6i-12-8i=-11-2i 


1.31 Simplifique (a) Pri, PEÃO) Pr, 


(a) P=1, P=(MD)=(-DD)= t=(OB=(-D-D=1 
bd) ===, i= (ÉP) = (8P) =P =-1, =° = i, fef=1 
(c) Usando = lei” = ¡1+ (14)%i7” = 14i" = i", dividimos o expoente n por 4 para obter o resto r. 


39 4(9)+3 (1º) P 18 P =i i174 = i = =], 52 0 1, pU 1 


1.32 Encontre o conjugado de cada um dos números complexos seguintes. 
(a) 6+4i, 7—5i, 4+i, —3 — i, (b) 6, —3, 4i, —9i. 
(a) 6+4i=6-4i, 7—5i=7+5i, 4+i=4-i, —3—i=-—3+i 
(b) 6-6, -3=-3, 4i = —4i, —9i = 9i 


(Observe que o conjugado de um número real é o próprio número real, mas o conjugado de um número imaginário puro 
é seu simétrico.) 

1.33 Encontre zz e |z| para z = 3 + 4i. 
Com z = a + bi usamos zZ = &@? + b? e z = vVzZ = Va? + b?. Logo, 


zZ=9 +16 = 25, z| = v25=5 
=. ff 
5+3i 


Para simplificar uma fração z/w de números complexos, multiplicamos pelo conjugado w do denominador tanto o nu- 
merador quanto o denominador. 


1.34 Simplifique 


= (2-7i)(5-3i) —11-4li 1 4, 
= = = 1 
543i (5+3i(5=3i 34 34 34 
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1.35 Demonstre que, para quaisquer números complexos z, w € C, (D)ztw=zZ+w, (ii) Zw = Zw, 


1.36 


1.37 


1.38 


1.39 


(iii) Z= 2. 


Suponha que z = a + 


Hbiew=c+di coma,b,c,d E R. 


O ZFw= (al 
= (al 


- bi) + (c +di) = (a+co)+(b+ di 
te)-—(b+d)i = a+c-—bi- di 
= (a-— bi) + (c — di) = Z+w 


Gi) zw = (a+bi(c+di) = (ac — bd) + (ad + boi 


(ac — bd) — (ad + bc)i 


(a — bi)(c — di) 


= zw 


(ui) Z 


a 


bi 


a 


(—-b)ji=a+bi=z 


Demonstre que, para quaisquer números complexos z e w, vale |zw| = |z| |w]. 


Pela parte (ii) do problema precedente, 


zw? = (2w)(2m) 


(25)(wi) = 


24,2 
lí Iv] 


Tirando a raiz quadrada dos dois lados dessa igualdade obtemos nosso resultado. 


Demonstre que, para quaisquer números complexos z e w, valez,w € C, |z + w| < |z| + |wl. 


Suponha que z = a + bi e w = c + di, com 4, b, c,d € R. Considere os vetores u = (a, b) e v = (c, d) de R’. Observe 


que 


z| = væ +8 = ||ull, 


IW = v? + dº = Iju 


a 


w=la+)+(b+ail= y (a +c} +(b+a) = a+cb+a)= ju 


Pela desigualdade de Minkowski (Problema 1.15), ||u + v|| < Ilul| + ||vlle, portanto, 


Encontre os produtos escalares u - v 
v = (4 + 2i,5 — 6i), (b) u= (3 — 2i, 4i, 1+6),v=(5+i,2-3i,7+2i). 


lz + w| = ju + v| < llull + [jell = [z| + [w] 


e 


v| 


v - u nos casos seguintes. (a) u= (1 — 2i, 3 +i), 


Não esqueça que no produto escalar aparecem os conjugados do segundo vetor. 


(cs) Ms Wp) = ZW + + Zp Wn 
(a) u: v = (1 — 2i)(4 + 2i) + (3 + i)(5 — 6i) 
= (1 — 2i)(4 — 2i) + (3 +i) (5 + 6i) = —10i +9 +23i = 9+ 13i 
v- u= (4+ 2i)\(1 = 2i) + (5 - 6) 8 +) 
= (4 + 2i)(1 + 2i) + (5 — 6i)(3 — i) = 10i +9- 23i = 9 — 13i 
(b) u- v= (3 — 2i)\(5 F i) + (4) (2 =3i) + (1 + 6)(TF 2i 
= (3 — 2i) (5 — i) + (4i)(2 + 3i) + (1 + 6i)(7 — 2i) = 20 + 35i 
v- u = (5 +i)(3 = 2i) + (2 — 3i) (4i) + (7 + 2i)(1 + 6i) 
= (5 + i)(3 + 2i) + (2 — 3i)(—4i) + (7 + 2i)(1 — 6i) = 20 — 35i 


Em ambos casos, v -u = u- v. Isso é válido em geral, conforme Problema 1.40. 


Sejam u = (7 — 2i, 2 + 5i)ev = (1 + i, —3 —6i). Encontre 


(a) u+, 


(b) 2iu, 


(c) 


G -= do, 


(d) u-v, 


(a) u+v=(7—2i+1+i, 2+5i-—3-— 6i)=(8-—i, —1— i) 
(b) 2iu = (14i — 42, 4i + 102) = (4+ 14i, —10 + 4i) 


;2 


(o) (3 


ijv = (3 + 3i 


9 


LE; 


(e) 


ul) e 


18/+31+62)=(4+2i, —15 — 15i) 


lloll. 
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(d) uv=(0-)(TF)j+(2+5)(=3=6) 
=(7-2)(1-D)+(2+5)-3+6) = 5-9:-36-3i = —31 — 12i 


© lul =y P+ (2+2 +5 = VB e lloll = y1? + 12+ (-3} + (-6} = v77 


1.40 Demonstre que, para quaisquer vetores u, v € C” e escalar z € C, (i) u- v = vu, (ii) (zu) : v = z(u- v), 
valem (iii) u - (zv) = Z(u - v). 
Suponha que u = (Z1, Z3,- -;Zp) € U= (W1, Wz,- -, Wp} 


(1) Usando as propriedades da conjugação, 


V: U = W121 + W23 + ++ F WpaZn = W121 + W223 dee F WpZn 
= WiZ) H WZ + E WpaZn = ZiWi H ZW + H Zp Wp SUU 
(ii) Como zu = (221,22,,...,2Z,), 


(2u):v=zaw, + ZZW + ++ + ZZW, = Z(Z1W1 + Z3W + +zm)=z(uUv) 


(Compare essa identidade com a do item (ii) do Teorema 1.2 para vetores de R”.) 
Gii) Usando (i) e (ii), 


u- (z0) = (zv) -u = z(u- u) = 20t) = Z(u =v) 


Problemas Complementares 


Vetores de R” 
1.41 Sejam u = (1, -2, 4), v = (3, 5, 1) e w = (2, 1,-3). Encontre 
(a) 3u-— 2v; (b) 5u + 3v -— 4w; (c) u-v, uw, vw; (d lull, oll; 
(e) 0, sendo 0 o ângulo entre u e v; (f) d(u, v); (g) proj(u, v). 


1 2 3 
1.42 Refaça o problema precedente com os vetores u = | ] sU= Í | w= |- ; 
—4 


1.43 Sejam u = (2,-5,4,6,-3) e v = (5,-2, 1,7, —4). Encontre 
(a) 4u—3v; (D) Su+20 (c) u-v; (d) llull e Io (©) proj(u, v); (f) d(u, v). 


1.44 Normalize cada vetor dado. 


ji 13 
@ u=(5,-7); O) v=(1,2,-2,4); (© w= (5-53) 


1.45 Sejam u = (1, 2, -2), v = (3, —12, 4) e r = -3. 


(a) Encontre |Jul], lloll, Ilu + vlļ e ||rul]. 


(b) Verifique que IJrul| = |r] llul] e que |lu + v|| < llul] + [oll 


1.46 Encontre x e y tais que 
(a) @,y + 1) = Q- 2, 6); b) x2, y) = y(l, -2). 


1.47 Encontre x, y e z tais que (x, y + 1, y + z) = (2x + y, 4, 3z). 


1.48 Escreva v = (2, 5) como uma combinação linear de u, e u,, sendo 
(a) u = (1, 2) e u, = (3, 5); 
(b) u = (3, 4) e u = (2,-3). 
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9 1 2 4 
1.49 Escreva v = [emo uma combinação linear de 4, = lz , u, = | ] , u3 = -2 . 
16 3 —1 3 


1.50 Encontre um escalar k tal que u e v sejam ortogonais, nos casos seguintes. 
(a) u = (3, k, -2), v = (6,-4,-3); 
(b) u = (5, k, —4, 2), v = (1, —3, 2, 2k); 
(c) u = (1,7, k + 2, -2), v = (3, k, -3, k). 


Vetores aplicados, hiperplanos e retas de R” 


1.51 Encontre o vetor v identificado com o segmento de reta orientado PO para os pontos dados. 
(a) P(2,3,-7) e Q(1,-6,-5) em R°; 
(b) P(1,-8,-4,6) e O(3,-5,2, 4) em Rº. 


1.52 Encontre uma equação do hiperplano H de R! que 
(a) contenha P(1, 2, —3, 2) e seja normal a u = [2, 3, —5, 6]; 
(b) contenha P(3, —1, 2, 5) e seja paralelo ao hiperplano 2x, — 3x, + 5x, — 7x, = 4. 


1.53 Encontre uma representação paramétrica da reta de Rº que 
(a) passe pelos pontos P(1, 2, 1, 2) e O(3,-5, 7, —9); 
(b) passe por P(1, 1, 3, 3) e seja perpendicular ao hiperplano 2x, + 4x, + 6x, — 8x, = 5. 


Vetores espaciais (de R°), notação ijk 


1.54 Sejam u = 3i — 4j + 2k, v = 2i + 5j — 3k e w = 4i + 7j + 2k. Encontre 
(a) 2u- 3v; (b) 3u+ 4v- 2w; (c) u-v, uw, vw; (d ljull, oll, w|]. 


1.55 Encontre uma equação do plano H que 
(a) tenha uma normal N = 3i — 4j + 5k e que contenha o ponto P(1, 2, 3); 
(b) seja paralelo ao plano 4x + 3y — 2z = 11 e que contenha o ponto Q(2, —1, 3); 


1.56 Encontre uma equação (paramétrica) da reta L que 
(a) passe pelo ponto P(2, 5, —3) na direção do vetor v = 4i — 5j + 7k; 
(b) seja perpendicular ao plano 2x — 3y + 7z = 4 e que contenha o ponto Q(1, —5, 7). 


1.57 Considere a curva C de R', com 0 < ż < 5, dada por 
F(t) = Pi — Pj + (2t — 3)k 
(a) Encontre o ponto P de C que corresponde a t = 2; 


(b) Encontre o ponto inicial Q e o ponto final Q’ de C; 


(c) Encontre o vetor tangente unitário T à curva C que corresponde a t = 2. 


1.58 Um certo objeto B em movimento tem sua posição no instante de tempo t dada por R(t) = fi + fj + 2k. 
[Então V(t) = dR(t)/dt e A(t) = dV(t)/dt denotam a velocidade e a aceleração de B, respectivamente. ] Quan- 
do t = 1, obtenha, para o objeto B, sua 


(a) posição R; (b) velocidade V; (c) velocidade escalar ||V|| e (d) aceleração A. 
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1.59 Encontre um vetor normal N e o plano tangente H a cada superfície dada no ponto dado. 
(a) A superfície xy + 3yz = 20 e o ponto P(1,3,2). 
(b) A superfície xX + 3y — 57 = 160€0 ponto P(3, —2, 1). 


Produto vetorial 


1.60 Calcule os determinantes e os simétricos de determinantes de ordem dois seguintes. 


(a) 2 5 3 —6 -4 =2 

3 6P JI s4 T =3 

6 4 1-3 8 —3 
(b) -|5 a -| 4l’ -|5 E 


1.61 Sejam u = 3i — 4j + 2k, v = 2i + 5j — 3k e w = 4i + 7j + 2k. Encontre 


(a) ux 0, (b) uxw, (c) vxw. 


1.62 Sejam u = [2, 1, 3], v = [4, -2, 2] e w = [1, 1, 5]. Encontre 


(a) ux 0, (b) uxw, (c) vxw. 


1.63 Encontre o volume V do paralelepípedo determinado pelos vetores u, v e w dados no 


(a) Problema 1.61 (b) Problema 1.62 


1.64 Encontre um vetor unitário u que seja ortogonal aos vetores 
(a) v= [1,2,3] e w = [1, -1, 2]; 
(b) v= 3i- j+ 2kew = 4i — 2j — k. 


1.65 Demonstre as propriedades seguintes do produto vetorial, válidas para quaisquer vetores u, v e w de R'e 


escalar r. 

(a) uxv=—(vxu) (d) ux(v+w)=(uxv-+(uxw) 
(b) ux u= Q para qualquer vetoru (e) (v+w)xu=(vxu)+(wxu) 
(c) (ru)xv=r(uxv)=ux (rv) (£) (uxvxw=(uwv-(vwu 


Números complexos 


1.66 Simplifique: 
9+2i 


au-nei © C- grs @ Ai 


4-7 


ias 1, 2+3i, 15 25 ;34. ss i 
1.67 Simplifique:@) z © zzp © iG A (35). 
1.68 Sejamz = 2 — 5iew = 7 + 3i. Encontre: (a) v+ w; (b) zw; (c) z/w; (d) Z, w; (e) lzļ, |wl. 
1.69 Mostre que para números complexos z e w quaisquer valem 


(a) Rez=i(z+27), (b) Imz=Łł}(z-2), (c) zw = 0 se, e só se, z= 0 ou w = 0. 


Vetores em C’ 


1.70 Sejam u = (1 + 7i,2 — 6i) e v = (5 — 2i, 3 — 4i). Encontre: 
(a) u+v (b) (3+iu (c) 2iu+(4+7i)v (d) u-v (e) lull e jul. 
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1.71 Demonstre que, para quaisquer vetores u, v, w em C” valem: 
e À 


(a) (u+ v):w=u:w+v:w, b) w(uto)=wut+w-u. 


1.72 Demonstre que a norma de C” satisfaz as propriedades seguintes. 
[N,] Dado qualquer vetor u, |u|| > 0e ||ul| = O se, e só se, u = 0. 
[N;] Dados quaisquer vetor u e complexo z, ||zul| = |z| Ilu]. 


[N;] Para quaisquer vetores u e v, |u + vl|| < |lul| + Jul]. 


Respostas dos Problemas Complementares 


1.41 (a) (—3,—16,10); - (b) (6,1,35; (© —3,—12,8; (d) v21, v35, v14; 
(e) -3/v21V35; (Ð v63; BD -å (3,5,1) =C} -1§,-3) 


1.42 (Vetores coluna) (a) (—1,7,—22); (b) (—-1,26,-29); (co) —15,-27,34; 
(d) v26, 30; (e) —-15/(V26V30), (Ð v86 O -Go=(-1,-1,-5 


1.43 (a) (-13,-14,13,45,0); (b) (20,-29,22,16,-23); (© -6; (d) V90,V95; 
(e) -v (®© v197 


1.44 (a) (5/V16, 9/76); (b) G, 2, <a 


vle 


J; (© (6/V133, —4V133, 9133) 
145 (a) 3, 13, VT20, 9 


1.46 (a) x=3, y=5; (b) x=0, y=0, e x=1l,y=2 


147 x=-3, y=3, z= 

1.48 (a) v= 5u; — u; (b) v= 16u — 23u 
1.49 v = 3u; — u + 2u, 

1.50 (a) 64 (b) 3 (0) 5 

1.51 (a) v=[-1,-9,2]; (b) [2,3,6,-10] 


1.52 (a) 2x, +3x, — 5x3 + 6x4, = 35; (b) 2x, — 3x, + 5x; — 7x4 = —16 


1.53 (a) [2t+1, -7t+2, tel, —11t+2); (b) [2t+1, dd; 6t+3, —8t +3] 
1.54 (a) —23j+13k; (b) 9i—6j—10k; (© —20,—12,37; (d) v29, v38, v69 


1.55 (a) 3x — 4y + 5z = —20; (b) 4x+3y-22=-—1 


1.56 (a) [4t+2, —5t+5, 7t- 3]; (b) [2t+1, —3t- 5, 7t+7] 


1.57 (a) P=F(2)=8i—4j+k; (b) Q=F(0)=-3k, Q' = F(5) = 125i — 25j + 7k; 
(o) T= (6i — 2j + k)/v41 


1.58 (a) i+j+2k; (b) 2i+3j+2k; (© v17; (d) 2146 


1.59 (a) N=6i+7j+9k, 6x+7y+9z=45; (b) N= 6i- 12j-— 10k, 3x-— 6y- 5z = 16 
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1.60 (a) -3,-6,26; (b) -2,-10,34 

1.61 (a) 2i+13j+23k; (b) —22i+2j+37k; (c) 3li— 16j-— 6k 

1.62 (a) [8,8,—-8]; (O) [2,-71]); (© [-12,-18,6] 

1.63 (a) 145; (b) 24 

1.64 (a) (7,1,-3)/V59; (b) (5i+11j-2k)/V150 

1.66 (a) 50—55; (b) —16-30i; (o) (4+7); (® 1(1+3); (e) -2-2i 

1.67 (3) —di ©) (6656+27); (O) Lil; (d) 5(4+3) 

1.68 (a) 9-2; (b) 29-29; (co) d(-1-4li)) (d 2+5, 7-3 (e) v29, v58 
1.69 (a) Sugestão: Se zw = 0, então |zw| = |z||w| = |0| = 0, 


1.70 (a) (6+5i, 5— 10); (b) (-4+22, 12-16); (o) (-8-4li, —4-— 33i); 
(d) 12+2i; (e) v90, v54 


Álgebra de Matrizes 


2.1 INTRODUÇÃO 


Neste capítulo estudamos as matrizes e suas operações algébricas. Essas matrizes podem ser vistas como tabelas 
retangulares de elementos, em que cada entrada depende de dois índices (diferente, portanto, dos vetores, em que 
cada entrada depende de apenas um índice). Os sistemas de equações lineares e suas soluções (Capítulo 3) podem 
ser entendidos eficientemente por meio da linguagem das matrizes. Além disso, alguns conceitos abstratos que 
serão introduzidos em capítulos posteriores, como “mudança de base”, “transformações lineares” e “formas qua- 
dráticas” podem ser representados por essas matrizes (tabelas retangulares). Por outro lado, o tratamento abstrato 
da Álgebra Linear que veremos mais adiante nos dará uma nova maneira de entender a estrutura dessas matrizes. 

As entradas de nossas matrizes provêm de algum corpo arbitrário K, que consideramos fixado. Os elementos 
de K são ditos números, ou escalares. Nada será perdido se o leitor simplesmente supor que K é o corpo R dos 
números reais. 


2.2 MATRIZES 


Uma matriz A sobre um corpo K ou, simplesmente, uma matriz A (quando K estiver subentendido) é uma tabela 
retangular de escalares, costumeiramente apresentada no formato seguinte. 


q dai? rei din 
gaar a Aon 
Im Am2 Amn 


As linhas de uma tal matriz A são as m listas horizontais de escalares dadas por 


(a11, a12- -+3 Ain)» (a21, a225- - -3 02), Fy (dai Ana ginn) 


e as colunas de A são as n listas verticais de escalares dadas por 


aii 2 Mn 

a21 a2 An 
; m aei 

ami Am? Amn 


Observe que o elemento a, denominado ij-ésima entrada, ou elemento, aparece na linha i e na coluna j. Em geral, 
denotamos uma tal matriz simplesmente escrevendo A = [a]. 

Dizemos que uma matriz com m linhas e n colunas é uma matriz m por n, que escrevemos m x n. O par de 
números m e n é dito o tamanho da matriz. Duas matrizes A e B são iguais, e escrevemos A = B, se ambas tiverem 
o mesmo tamanho e se as entradas correspondentes forem iguais. Assim, a igualdade de duas matrizes m x n é 
equivalente a um sistema de mn igualdades, uma para cada par de entradas correspondentes. 
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Uma matriz com apenas uma linha é denominada matriz linha, ou vetor linha, e uma matriz com apenas uma 
coluna é denominada matriz coluna, ou vetor coluna. Dizemos que uma matriz que tem todas as entradas nulas é 
uma matriz nula ou matriz zero, sendo denotada por 0. 

As matrizes com todas as entradas dadas por números reais são ditas matrizes reais, ou matrizes sobre R. Ana- 
logamente, as matrizes com todas as entradas dadas por números complexos são ditas matrizes complexas, ou 
matrizes sobre C. Neste texto, tratamos praticamente só com matrizes reais e complexas. 


Exemplo 2.1 


1 —4 5 
(a) A tabela retangular 4 = Ê 3 E é uma matriz 2 x 3. Suas linhas são (1, —4, 5) e (0, 3, —2) e suas 
colunas são 


1 —4 5 
0’ 3” —2 
; 10000 
(b) a matriz nula 2 x 4 é dada por 0 = f o 0 o | 
(c) Encontre x, y, z, t tais que 


x+y 2+t| |3 7 
x-y z-t| |1 5 


Por definição de igualdade de matrizes, as quatro entradas correspondente devem ser iguais. Assim, 


x+y=3, x—y=1, 2z+t=7, z-—t=5 


Resolvendo esse sistema de equações, obtemos x = 2, y = 1, z = 4, t l; 


2.3 SOMA DE MATRIZES E MULTIPLICAÇÃO POR ESCALAR 


Sejam A = [a;l eB= [b;] duas matrizes de mesmo tamanho, digamos, m x n. A soma de A e B, denotada por 
A + B, é a matriz obtida pela soma de elementos correspondentes de A e B, ou seja, 


ay +b apvtbo ... ant, 
A+B an tb an +bn ... an +b 
Am T bmi Am2 T Dm2 < Am + Dam 


O múltiplo da matriz A pelo escalar k, denotado por k - 4 ou, simplesmente, kA, é a matriz obtida pelo produto de 
cada elemento de A por k, ou seja, 


ka, ka aaa kar, 
kA 2 kaz; ka,» PRR kaz, 
kapı kama Kan 


Observe que ambas, A + B e kA, são matrizes m x n. Também definimos 
-A=(-IDA e A-B=A+(-B) 


Dizemos que —A é a matriz simétrica de A e que A — B é a matriz diferença de A e B. Não se define a soma de ma- 
trizes de tamanhos distintos. 
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1 —2 4 
Exemplo 2.2 Sejam dadas 4 = Ê 4 d e s=] É 5) então 


a 
A+B= 
0 
Ea aa a ; -6 i 
34 = = 
30) 4) 3(5)] Jo 12 15 
$ = E a e a 
0 $ NES 9 alo 17 | 


Dizemos que a matriz 24 — 3B é uma combinação linear de A e B. 


24 —3B = 


Em seguida apresentamos as propriedades básicas da soma e da multiplicação por escalar de matrizes. 


Teorema 2.1 Sejam A, B e C matrizes quaisquer (de mesmo tamanho) e k e k’ escalares quaisquer. Então 
G) (A+B)+C=A-+(B+C), (v)  k(A+B)= kA + kB, 


GD) A+0=0+4=4, (vi) (k+k)A= kA + kA, 
Gi) A+(-4)=(-4A)+4=0, (vi) (kk')A = k(k'A), 
(iv) A+B=B+4, (viii) 1-4 =A. 


Observe que, nos itens (ii) e (iii) do teorema, o O se refere à matriz nula. Também, por (i) e (iv), podemos es- 
crever qualquer soma finita de matrizes 


Ai tA +t: tA, 


sem utilizar parênteses, sendo que essa soma não depende da ordem das matrizes. Além disso, usando (vi) e (viii), 
também temos 


AFA=2A, AFA+rFA=3A, 


e assim por diante. 

A demonstração do Teorema 2.1 se reduz a mostrar que são iguais os ij-ésimos elementos de cada lado das 
equações matriciais. (Ver Problema 2.3.) 

Observe a semelhança que ocorre entre o Teorema 2.1 para matrizes e o Teorema 1.1 para vetores. Na verdade, 
essas operações matriciais podem ser vistas como generalizações das operações vetoriais correspondentes. 


2.4 O SÍMBOLO DE SOMATÓRIO 


Antes de definir a multiplicação de matrizes, convém introduzir o símbolo de somatório X (a letra grega maiúscula 
sigma). 
Suponha que f(k) seja uma expressão algébrica a uma variável k. Então a expressão 


DJs 


f(k) ou, equivalentemente, 344 f(k) 


k=1 


tem o significado como segue. Inicialmente, tomamos k = 1 em f(k) e obtemos 


fu) 


Em seguida, tomamos k = 2 em f(k) e obtemos f(2) que, somado com f(1), fornece 


fO) + fO) 
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Em seguida, tomamos k = 3 em f(k) e obtemos f(3) que, somado com a soma precedente, fornece 


FO) + f2) + SB) 


Continuamos esse processo até obter a soma 


FO) +S) ++ fm) 


Observe que, a cada passo, aumentamos o valor de k em 1 unidade até alcançarmos n. Dizemos que a letra k é o 
índice do somatório e que 1 e n são, respectivamente, as extremidades inferior e superior do somatório. No lugar 
de k frequentemente utilizamos outras letras, como i ou j, para índice. 

Também generalizamos nossa definição permitindo que a soma varie desde algum inteiro n, qualquer até al- 
gum inteiro n, qualquer, ou seja, definimos 


SIGO) =) +f H1) +f + D+ Sm) 


k=n; 


Exemplo 2.3 

5 n 
(a) XO xg = x1 HX + X3 + X4 + X5 e Š a;b; = a;b; + aba +-:-+a,b, 
k=1 j=1 


i= 


5 n 
b) Y =24+32+4+5=54 e Pax = ay tax +a x ++ a,x" 
j=2 i=0 


P 
(c) 2 dirbi = and; aa ado; + abs; dd aipbpj 


2.5 MULTIPLICAÇÃO DE MATRIZES 


O produto das matrizes A e B, denotado por AB, é um pouco mais complicado. Por isso, começamos com um caso 
especial. 

O produto AB de uma matriz linha A = [a,] e uma matriz coluna B = [b] com o mesmo número de elementos 
é definido como o escalar (ou a matriz 1 x 1) obtido pela soma dos produtos das entradas correspondentes, ou seja, 


bı 

AB = |a; az, ...,a,] b> =abitab,+---+a,b, => ab, 
dad rei 
b 


n 


Enfatizamos que, nesse caso, AB é um escalar (ou, então, uma matriz 1 x 1). Não definimos o produto AB se a 
matriz linha A e a matriz coluna B possuírem um número distinto de elementos. 


Exemplo 2.4 
3 
tai [7,—4,5]| 2| =7(3)+(—4)(2)+5(-1)=21-8-5=8 
-1 
4 
(b) [6,-1,8,3] É =24+9-16+15=32 
5 


Agora, estamos preparados para definir o produto de matrizes mais gerais. 
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DEFINIÇÃO Sejam A = [a,]JeB= [b,] duas matrizes tais que o número de colunas de A seja igual ao número 
de linhas de B, digamos p. Ou seja, supomos que A seja uma matriz m x p e B uma matriz p x n. Então o produto 
AB de A e B é a matriz m x n cuja ij-ésima entrada é dada pelo produto da i-ésima linha de A com a j-ésima coluna 
de B. Assim, 


41 Tp by by; bin Cil >+- Cin 
aj dip = Cij 
am > anp] lbn ER Cm1 Cia 


P 
onde Ci; = ajbi; + anb Ra i dipbpj = x AD 
=] 


Não definimos o produto AB quando A é uma matriz m x p e B é uma matriz q x n com p £ q. 


Exemplo 2.5 


1 3 2 0 —4 
(a) Encontre AB se 4 = E iles É 2 1 


Como A tem tamanho 2 x 2e B 2 x 3, o produto AB está definido e é uma matriz 2 x 3. Para obter a pri- 
meira linha da matriz produto AB, multiplicamos a primeira linha [1, 3] de A com cada uma das três colunas 


sh lab [a 


de B. Ou seja, 


aga [2418 0— 6 e —6 ii 


Para obter a segunda linha de AB, multiplicamos a segunda linha [2, —1] de A com cada coluna de B. Assim, 


17 -6 14 17 -6 14 
a=, 5 0+2 -8 dels 2 Ei 
1 2 
(b) Sejam 4 = |; 3l e pelo 5 | Então 
[5+0 6-4] [5 2 — [5+18 10+24] [23 34 
ge, Rea J E = [er Rei. A 


Esse exemplo mostra que a multiplicação matricial não é comutativa, ou seja, em geral, AB £ BA. No entanto, 
a multiplicação matricial satisfaz as propriedades seguintes. 


Teorema 2.2 Sejam A, Be C matrizes. Sempre que os produtos e somas envolvidos estiverem definidos, valem 
(1) (AB)C = A(BC) (associatividade do produto), 
(ii) A(B + C) = AB + AC (distributividade à esquerda), 
Gii) (A + B)C = AC + BC (distributividade à direita), 
(Gv) K(AB) = (kA)B = A(kB), onde k é um escalar. 


Observe que AO = 0 e OB = 0, onde O é a matriz nula. 
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2.6 TRANSPOSTA DE UMA MATRIZ 


3 T . já 
A transposta de uma matriz A, denotada por A , é a matriz obtida escrevendo as colunas de A, na mesma ordem, 
como linhas. Por exemplo, 


r [1 4 1 
E f | =|25 e [1,=3,=5]/ = | =3 
3 6 -5 


Em outras palavras, se A = la, é uma matriz m x n, então A” = [Db] é a matriz n x m dada por b; = d; 

Observe que a transposta de um vetor linha é um vetor coluna. Analogamente, a transposta de um vetor coluna 
é um vetor linha. 

O teorema a seguir enumera as propriedades básicas da transposição. 


Teorema 2.3 Sejam A e B matrizes e k um escalar. Então, sempre que os produtos e somas envolvidos estiverem 
definidos, valem 

G) (A+B =A +B", (ii) (kA) = KAT, 

GD (ADÍ=A, (iv) (AB)! = BTA". 


Enfatizamos que, por (iv), a transposta de um produto é o produto das transpostas, só que na ordem inversa. 


2.7 MATRIZES QUADRADAS 


Uma matriz é dita quadrada se tiver o mesmo número de linhas e colunas. Dizemos que uma matriz quadrada 
n x né de ordemn. 

Vimos que nem sempre é possível somar ou multiplicar duas matrizes quaisquer. No entanto, considerando 
apenas matrizes quadradas de alguma dada ordem n, esse inconveniente desaparece. Em outras palavras, as opera- 
ções de adição, multiplicação, multiplicação por escalar e transposição podem sempre ser efetuadas com matrizes 
quadradas n x n, e o resultado da operação é uma matriz quadrada n x n. 


Exemplo 2.6 Duas matrizes quadradas de ordem 3 são as seguintes. 


1 2 3 2 =5 1 
A= |—4 —4 —4 e B=|0 3 =2 
5 6 7 1 2 —4 


As seguintes matrizes também são matrizes de ordem 3. 


3 -3 4 2 4 6 1 —4 5 
A+B=|[-4 -1 -6|, 24= |-8 -8 -8|, AT=|2 4 6 
6 8 3 10 12 14 3 <=d 7 

5 7 =5 27 30 33 

AB = | -12 0 20l, BA = | —22 —24 -26 

17 7 =35 —27 -30 -33 


Diagonal e traço 


Seja A = [a,] uma matriz quadrada de ordem n. A diagonal, ou diagonal principal de A consiste nos elementos 
com índices iguais, isto é, 


1; a2, 433, Heng ann 
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O traço de A, denotado por tr(A), é a soma dos elementos da diagonal principal, a saber, 


tr(4) = aj + an + a33 + + am 
Vale o teorema a seguir. 


Teorema 2.4 Sejam A e B matrizes quadradas de mesma ordem e k um escalar. Então valem 
(i) tr(4+B)=tr(4) +tr(B), Gii) tr(AD) = tr(4), 
Gi) tr(kA) = k tr(4), (iv) tr(4B) = tr(BA). 


Exemplo 2.7 Sejam A e B as duas matrizes quadradas do Exemplo 2.6. Então 


diagonal de A = {1, —4, 7} e t(A)=1—-4+7=4 
diagonal de B = (2,3, 4) e t(B)=2+3—-4=1 


Além disso, 
tr(A+B)=3-1+3=85, tr(24)=2-8414=8, tr(4)=1-4+7=4 
tr(AB) = 5 + 0 — 35 = —30, tr(BA) = 27 — 24 — 33 = —30 

Conforme afirma o Teorema 2.4, temos 
tr(A + B) = tr(A) + tr(B), t(4^) = tr(A), tr(2A) = 2 tr(A) 


Além disso, mesmo tendo 4B + BA, os traços desses produtos são iguais. 


Matriz identidade, matrizes escalares 


A matriz identidade, ou matriz unitária, de ordem n, denotada por 1, ou, simplesmente, por 1, é a matriz quadrada 
com 1 na diagonal principal e O em todas as demais entradas. A matriz identidade 7 é análoga ao escalar 1, pois, 
dada qualquer matriz A, temos 


AI=IA=A 


Mais geralmente, se B é uma matriz m x n, então BI, = 1,B = B. 


m 


Dado qualquer escalar k, dizemos que a matriz kI, com k na diagonal principal e O em todas as demais entradas, 
é a matriz escalar correspondente ao escalar k. Observe que 


(KDA = KA) = kA 


Ou seja, multiplicar uma matriz A pela matriz escalar kI é equivalente a multiplicar A pelo escalar k. 


Exemplo 2.8 As matrizes identidade de ordem 3 e 4 e as matrizes escalares correspondentes a k = 5 são as se- 
guintes. 


1 5 


Som 
Soho 


OBSERVAÇÃO 1 É costume omitir blocos ou padrões de zeros quando não houver dúvidas sobre essas entradas, 
como fizemos na segunda e quarta matrizes do exemplo. 


OBSERVAÇÃO 2 A função delta de Kronecker dj é definida por 
0 sei; 


1 sei=j 


Assim, podemos escrever a matriz identidade como 1 = [ô;]. 
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2.8 POTÊNCIAS DE MATRIZES, POLINÔMIOS MATRICIAIS 


Seja A uma matriz quadrada de ordem n com entradas de algum corpo K. As potências de A são definidas como segue. 
A = AA, A = AA, A AMI = AA, ae e Aº=T 


Também definimos polinômios da matriz A. Mais precisamente, dado qualquer polinômio 


em que os coeficientes a, são escalares de K, definimos a matriz fA) como segue. 


HA) = agf HajÃ4 aA? PEE aA" 


[Observe que f(A) é obtida de f(x) substituindo a variável x pela matriz A e substituindo o escalar a, pela matriz 
escalar aç.] Se KA) for a matriz nula, dizemos que A é um zero ou raiz de f(x). 


E BI: 
Exemplo 2.9 Se A = 3 —q | então 


a 1 2]l1i 207 -6 32 2. [7 -6][1 2] [-11 38 
A Ê Alls = ug a| CA AAS o ala og] | 57 <=106 
Sejam fx) = 2x — 3x + 5 e g(x) =x + 3x — 10. Então 


sa EAR Sep 


w=] PIREN alol |= fo o 


Assim, A é um zero do polinômio g(x). 


2.9 MATRIZES INVERTÍVEIS (OU NÃO SINGULARES) 
Uma matriz quadrada A é dita invertível, ou não singular, se existir uma matriz B tal que 
AB=BA=I 
onde 7 é a matriz identidade. Uma tal matriz B é única. Ou seja, se AB, = BA =I e AB, = B,A = I, então 
B, = BI = B;(AB,) = (Bj4)B, = IB, = B, 
Dizemos que uma tal matriz B é a inversa de A e a denotamos por A”. Observe que a relação que define a inversa é 


simétrica; ou seja, se B for a inversa de A, então A será a inversa de B. 


Exemplo 2.10 Suponha que 4 = f > e B= i 5 | Então 


_[6-5 -10+10] [10 [6-5 15-15] [10 
4B= [553 le o ° BA=[ 573 e] | 


Assim, B é inversa de A e A é inversa de B. 


Sabe-se (Teorema 3.18) que AB = I se, e só se, BA = I. Assim, é necessário testar apenas um produto para 
determinar se duas matrizes são, ou não, inversas. (Ver Problema 2.17.) 

Agora suponha que A e B sejam invertíveis. Então AB é invertível e (AB)! = B` A`. Mais geralmente, se 4,, 
As, ..., A, forem invertíveis, então seu produto é invertível e a inversa 


=] z zie 
(AA, ... Az) = PROPOR AZ AT! 


é o produto das inversas na ordem inversa. 
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Inversa de uma matriz 2 x 2 


a b 
Seja A uma matriz 2 x 2 arbitrária, digamos, 4 = | E dj Queremos deduzir uma fórmula para a inversa A! de 
A. Mais precisamente, queremos encontrar 2” = 4 escalares, digamos, x,, Yı, X, € y, tais que 
a bllx x | |1 0 EA axı +byy av +by | |1 0 
c dlly »| |O 1 cxt+dy cxa +t dy | |0 1 
Igualando as quatro entradas com as entradas correspondentes da matriz identidade, obtemos quatro equações, que 
podem ser repartidas em dois sistemas 2 x 2, como segue. 


axı +by = 1, ax, + by, = 0 
CX] + dy, = 0, CX, + dy, =1 


Denotemos por |A| = ab — bc o assim chamado determinante de A. Supondo que |A| £ 0, podemos resolver em x,, 
Yp X € y, de maneira única, obtendo 


= Bi Se = 
ET al “2 up 24 
Segue que 
gan fa db [aa Ml] 1[a — 
“le d| I-cl4) a/4l) |ll-c a 


Em outras palavras, quando |4| 0, a inversa de uma matriz A de ordem 2 pode ser obtida de A como segue. 


(1) Trocamos de lugar os dois elementos da diagonal principal. 
(2) Trocamos o sinal dos dois outros elementos. 
(3) Multiplicamos a matriz resultante por 1//A] ou, equivalentemente, dividimos cada elemento por [A]. 


Se |4| = 0, então a matriz A não é invertível. 


. 23 1 3 
Exemplo 2.11 Encontre a inversa de Á = e = i 


Primeiro calculamos |4| = 2(5) — 3(4) = 10 — 12 = —2. Como |4| £ 0, a matriz A é invertível e 


1 5 3 S 3 
Ri =. = 2 2 
A 5l | | 2 E 


Agora calculamos |B| = 1(6) — 3(2) = 6 — 6 = 0. Como |B| = 0, a matriz B não tem inversa. 


OBSERVAÇÃO A propriedade de uma matriz ser invertível se, e só se, seu determinante for não nulo vale para 
matrizes quadradas de qualquer ordem. (Ver Capítulo 8.) 
Inversa de uma matriz n x n 


+ . . — Z 
Suponha que A seja uma matriz quadrada de ordem n qualquer. Encontrar a inversa 4 de A se reduz, também 
nesse caso, a encontrar a solução de uma coleção de n sistemas n x n de equações lineares. A solução de tais siste- 
mas e uma maneira eficiente de resolvê-los serão abordadas no Capítulo 3. 


2.10 TIPOS ESPECIAIS DE MATRIZES QUADRADAS 
Nesta seção descrevemos alguns tipos especiais de matrizes quadradas. 


Matrizes diagonais e triangulares 


Dizemos que uma matriz quadrada D = [d,] é diagonal se todos os seus elementos fora da diagonal principal fo- 
rem nulos. As vezes, denotamos uma tal matriz por 


D = diag(d,,, dy, -eeg dn) 
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em que alguns d, 


ii? 


ou todos, podem ser nulos. Por exemplo, 
6 

3 0 0 

0 —7 01, 

0 02 

são matrizes diagonais que podem ser representadas, respectivamente, por 


diag(3, —7, 2), diag(4, —5), diag(6, 0, -9, 8) 


(Observe que o padrão de zeros foi omitido na terceira matriz.) 

Uma matriz quadrada A = [a,] é triangular superior ou, simplesmente, triangular se todas as suas entradas 
abaixo da diagonal (principal) forem nulas, ou seja, se a, = 0, para i > j. Algumas matrizes triangulares superiores 
arbitrárias de ordens 2, 3 e 4 são dadas a seguir. 


Cu Cj Cj Ci 

dd bu bo br C22 C23 Co 
0 a , by» bos , C33 Cai 
bas C44 


(Assim como nas matrizes diagonais, é costume omitir padrões de zeros.) 
Vale o teorema a seguir. 


Teorema 2.5 Sejam A = [a ] e B = [b,] matrizes n x n triangulares (superiores). Então 


(1) A + B, kA e AB são triangulares com respectivas diagonais dadas por 
(an + bii Ava ann + bnn)» (kar, o kann), (ambi, ER, Coal) 


Gi) Dado qualquer polinômio f(x), a matriz f(A) é triangular com diagonal 


(flan) f (an), -f (Ann) 


(iii) A é invertível se, e só se, cada elemento diagonal de A for não nulo, ou seja, a; + O; além 
. dio i . -1 z 4 : 
disso, se existir, a inversa A também é triangular. 


Uma matriz triangular inferior é uma matriz quadrada cujas entradas acima da diagonal são todas nulas. Obser- 
vamos que o Teorema 2.5 também vale substituindo “triangular” tanto por “triangular inferior” quanto “diagonal”. 


OBSERVAÇÃO Uma coleção não vazia de matrizes é dita uma álgebra matricial se for fechada em relação às 
operações de adição, multiplicação por escalar e multiplicação matriciais. Claramente, a coleção das matrizes qua- 
dradas de alguma ordem fixada constitui uma álgebra de matrizes, bem como a das matrizes escalares, diagonais, 
triangulares e triangulares inferiores. 


Matrizes quadradas reais especiais: simétricas, ortogonais, normais 
[opcional até o Capítulo 12] 


Seja, agora, A uma matriz quadrada com entradas reais, ou seja, uma matriz quadrada real. A relação entre A e sua 
T p . . 
transposta 4 fornece espécies importantes de matrizes. 


(a) Matrizes simétricas 


. . 2o io fi T . 2. 2. ` 2 
Dizemos que uma matriz A é simétrica se A = A. Equivalentemente, A = [a,] é simétrica se seus elementos simé- 
tricos (aqueles que são espelhados pela diagonal) forem iguais, ou seja, se a, = a; para cada ij. 

Uma matriz A é dita antissimétrica se A = —A ou, equivalentemente, se a; = —a;, para cada ij. Claramente, os 
elementos diagonais de uma tal matriz devem ser, todos, nulos, pois a; = —a, implica a, = 0. 
T T ~ . P 
(Observe que, se A = A ou A = —A, então A necessariamente é quadrada.) 
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E 15 0 3 4 100 
Exemplo 2.12 Sejam4= |-3 6 7|,B=|-3 0 5 geli 0 i 
5 7 -8 + -5 0 


(a) Visualmente, os elementos simétricos de A são iguais, ou A =A, Assim, A é simétrica. 

(b) Os elementos diagonais de B são O e os elementos simétricos têm sinal oposto, ou B” = —B. Assim, B é antis- 
simétrica. 

(c) Como C não é quadrada, não pode ser nem simétrica nem antissimétrica. 


(b) Matrizes ortogonais 


. 2 T -1 . T T . . . 
Uma matriz real é ortogonal se A = À ou, ou seja, se AA = AA = I. Assim, necessariamente, toda matriz orto- 
gonal é quadrada e invertível. 


ND |— Ole oloo 


Exemplo 2.13 Seja 4 = . Multiplicando A por 4”, obtemos 1, ou seja, AA” = I. Isso significa 


NDl0o NO NO 
NOIR DI NOIR 


que, também, AA =l. Assim, A = A`”, ou seja, À é ortogonal. 


Seja, agora, A uma matriz real ortogonal 3 x 3 com linhas 
u, = (a, a, 45), u, = (by, Do, b3), Us = (Ci, 05,3) 
Por ser ortogonal, temos AA! =], ou seja, 


i d) d3 a bh; c 1 0 0 
dA = |b; b bello b al=|0 1 0)=1 
C] Cs C3 a3 b, C3 0 0 1 


Multiplicando A por A” e igualando cada entrada com a correspondente de 1, obtemos as nove equações seguintes. 


aí + as + as = l; abı + ab, + azb, = 0, q,C1 q,C5 d3C3 = 0 
bia + ba, + bas = 0, bi + b + b3 = 1; bici bc, b3c3 = 0 
cC1đı + C243 + C343 = 0, cibi + cb, + c3b3 = 0; cito +cs = 1 


Vemos que u; -um = 1, u : u = 1, uz uz = leu,- u; = 0, comi Æ j. Assim, as linhas u,, u,, u, de A são vetores 
unitários e dois a dois ortogonais. 


Em geral, dizemos que os vetores u,, 15, ..., Up de R” constituem um conjunto ortonormal se os vetores forem 
unitários e dois a dois ortogonais, ou seja, 


Em outras palavras, u; - u; = dj onde dj é o delta de Kronecker. 

Mostramos que a condição AA” = I implica que as linhas de A constituem um conjunto ortonormal de vetores. 
Do mesmo modo, a condição A*A = I implica que também as colunas de A formam um conjunto ortonormal de 
vetores. Além disso, como cada passo do argumento é reversível, a recíproca também é verdadeira. 


Esses resultados para matrizes 3 x 3 são verdadeiros em geral. Isto é, vale o teorema a seguir. 


Teorema 2.6 Seja A uma matriz real. As afirmações seguintes são equivalentes. 


(1) A é ortogonal. 
(11) As linhas de A constituem um conjunto ortonormal. 
(iii) As colunas de A constituem um conjunto ortonormal. 


Para n = 2, temos o resultado seguinte (demonstrado no Problema 2.28). 
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Teorema 2.7 Seja A uma matriz real e ortogonal 2 x 2. Então, para algum número real 0, temos 


J= cos0 sen dis cos 0 sen 0 
=~ |-sen6 cos da “| senf -—cos6 


(c) Matrizes normais 


. 24 T . T T : Leu 
Uma matriz real A é dita normal se comutar com sua transposta A , ou seja, se AA = A A. Se A for simétrica, orto- 
gonal ou antissimétrica, então A é normal. Também há outras matrizes normais. 


6 —3 
3 6 


wa o e E E a 


Como AA” = A'A, a matriz A é normal. 


Exemplo 2.14 Seja 4 = | | eno 


2.11 MATRIZES COMPLEXAS 


Seja A uma matriz complexa, isto é, uma matriz com entradas complexas. Na Seção 1.7 vimos que, se z = a + bi 
for um número complexo, então seu conjugado é Z = a — bi. A conjugada de uma matriz complexa A, denotada 
por 4, é a matriz obtida de A tomando o conjugado de cada entrada de A. Ou seja, se A = [a,), então A= [b;;], com 
bi = 4jj. (Isso é denotado escrevendo 4 = [ã;) .) 

As duas operações de transposição e conjugação comutam para qualquer matriz complexa A, e utilizamos a 
notação especial A” para a transposta conjugada da matriz A. Ou seja, 


Observe que, se A for real, então A” = A”. [Muitos livros usam A* no lugar de A”.] 
; : ; 2-— ŝi —6i 
2+8i 5-3 4-Ti 
x y n . Então 4 = 5+3i 1 +4i 
6 l—4i 3+2 
' O RE AT. GM 


Exemplo 2.15 Seja 4 = 


Matrizes complexas especiais: hermitianas, unitárias, normais 
[opcional até o Capítulo 12] 


. . ~ . H 2. . 
Considere uma matriz complexa A. A relação entre A e sua transposta conjugada A” fornece espécies importantes 
de matrizes complexas (análogas às espécies de matrizes reais que já vimos). 


Dizemos que uma matriz complexa A é hermitiana ou antihermitiana se 
H H 
A =AqA = A. 


Claramente, A = la; é hermitiana se, e só se, seus elementos simétricos forem conjugados, ou seja, se cada 
di; = ji, caso em que cada elemento a; da diagonal deve ser real. Analogamente, se A for antihermitiana, então 

E H H ~ . z 
cada elemento da diagonal deve ser nulo, a; = O. (Observe que se A = A ou A = —A, então A necessariamente é 


quadrada.) 
Uma matriz complexa é unitária se AA” = A“A = I, ou seja, se 
A” = A" 


Assim, necessariamente, toda matriz unitária é quadrada e invertível. Observamos que uma matriz complexa A é 
unitária se, e só se, suas linhas (colunas) formam um conjunto ortonormal relativo ao produto escalar de vetores 
complexos. 

Uma matriz complexa A é dita normal se comutar com A”, ou seja, se 


AA” = A”A 
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(Assim, toda matriz normal é quadrada.) Essa definição coincide com a dada para matrizes reais quando A for uma 
matriz real. 


Exemplo 2.16 Consideremos as matrizes complexas seguintes. 


3 1-2i 4+7i 1 -i eai 
A=È1+2i <4 2i B=5 i 1 15: gafe ie 
4-7 2i 5 l+i -I+i o i É 


(a) Visualmente, os elementos diagonais de A são reais e os elementos simétricos 1 — 2i e 1 +2i,4 + Tie 4 
7i, bem como -2i e 2i são, todos, conjugados. Assim, A é hermitiana. 

(b) Multiplicar B por B” fornece J, ou seja, BB” =I. Isso implica que também BB =I. Assim, B” = B',o que 
significa que B é unitária. 

(c) Para mostrar que C é normal, calculamos C C” e C”C. Temos 


CCE = 2+3i 1 2-3. —i | | 14 4-—4i 
= i l+2i 1 1—2i| |4+4i 6 


14 4— 4i 
e, analogamente, CÊC = F +4i 6 Í . Como CC” = C“C, essa matriz complexa C é normal. 


Observamos que, para matrizes reais, ser hermitiana é o mesmo que ser simétrica, e ser unitária é o mesmo que ser 
ortogonal. 


2.12 MATRIZES EM BLOCOS 


Utilizando um sistema de linhas (tracejadas) horizontais e verticais, podemos particionar uma matriz A em subma- 
trizes denominadas blocos de A. Certamente podemos dividir uma matriz em blocos de maneiras diferentes. Por 
exemplo, 


1-2/0 1/3 1-2210 1.3 1-2 01 3 
2 315 71-2 2 31572 2.3. 517.2 
3 1/4519) 3. 1145 í9/ 3 1 4159 
4 61-3 118 4 6/3 I 8 4 6 -3il 8 


A conveniência da partição de matrizes em blocos, digamos, A e B, é que o resultado das operações com A e B pode 
ser obtido fazendo as operações em seus blocos, como se fossem autênticos elementos das matrizes. Ilustramos 
isso a seguir, onde utilizamos a notação A = [A,] para uma matriz em blocos A com blocos A,.. 

Suponha que A = [A,] e B = [B,] sejam matrizes em blocos com o mesmo número de blocos linha e coluna e 
suponha que blocos correspondentes tenham o mesmo tamanho. Então a soma de blocos correspondentes de A e de 
B também soma os elementos correspondentes de A e de B e a multiplicação de cada bloco de A pelo mesmo esca- 
lar k multiplica cada elemento de A por k. Assim, 


An+By Ap+Bp ... Ayn+By 
ipe Az +B An +Byo vc. An +B 
Ami Bm Am Bm --- Amn +Bmn 
e 
kA; kân KA, 
e Ba kán 
KA Kyo Elia 
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O caso da multiplicação matricial é menos óbvio, mas ainda é válido. Isto é, digamos que U = [U,Je V = [V,] 
sejam matrizes em blocos tais que o número de colunas de cada bloco U, seja igual ao número de linhas de cada 
bloco V,, de modo que esteja definido cada produto U,V, Então 


Wu Wiz Win 
UV = 21 2a an ; onde Wj = Ui Vi + UaV = E Dava 
Wa Wm W mn 


A demonstração dessa fórmula para UV é imediata, mas cheia de detalhes e demorada. Por isso, é deixada como 
exercício (Problema Complementar 2.86). 


Matrizes quadradas em blocos 


Seja M uma matriz em blocos. Dizemos que M é uma matriz quadrada em blocos se 


(1) M é uma matriz quadrada, 
(ii) os blocos formam uma matriz quadrada e 
(iii) os blocos da diagonal também são matrizes quadradas. 


Essas duas últimas condições ocorrem se, e só se, houver o mesmo número de linhas tracejadas horizontais e 
verticais e se estiverem posicionadas simetricamente. 


Considere as duas matrizes em blocos seguintes. 


1 213 4,5 1 213 dus 
1 111 111 1101 10 
Á=|[9 8 76,5 e B=ẹ|9 8,7 6,5 
4 414 414 4 414 414 
3 513 513 3 513 5,3 


A matriz em blocos A não é uma matriz quadrada em blocos, porque o segundo e o terceiro blocos da diagonal não 
são quadrados. No entanto, a matriz em blocos B é uma matriz quadrada em blocos. 


Matrizes diagonais em blocos 


Seja M = [A,] uma matriz quadrada em blocos. Dizemos que M é uma matriz diagonal em blocos se todos os blo- 
cos não diagonais de M forem matrizes nulas, ou seja, A; = 0, comi Æ j. Às vezes, denotamos uma tal matriz por 


M = diag(A,,, As, -> A,,) ou M=A BA» DA, 


A importância das matrizes diagonais em blocos se deve ao fato de que a álgebra de matrizes em blocos, frequen- 
temente, se reduz à álgebra dos blocos individuais. Especificamente, suponha que f(x) seja um polinômio e que M 
seja a matriz diagonal em blocos que acabamos de considerar. Então f(M) é uma matriz diagonal em blocos e 


fM) = diagh), HA o), -> ÃA,,)) 


Z s 7 r 2. 7 1. . . 
Também vale que M é invertível se, e só se, cada 4, é invertível e, nesse caso, M é uma matriz diagonal em blocos, 
com 
M`! = diag(An), A A3!) 
= iag( 11 42220. 90 E o o d 
Analogamente, uma matriz quadrada em blocos é dita matriz triangular superior em blocos se os blocos abai- 


xo da diagonal forem matrizes nulas e é dita matriz triangular inferior em blocos se os blocos acima da diagonal 
forem matrizes nulas. 
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Exemplo 2.17 Encontre as matrizes quadradas, triangulares superiores, triangulares ou diagonais dentre as ma- 
trizes seguintes. 


12,0 aro 1100) BIO 
A=|3 415|, B= ok C= [0,2 3|, D=|3 4,5 
Feni 5'0 6'0 do A 
0 016 To 014 5 0 617 


(a) A é triangular superior, porque o bloco abaixo da diagonal é uma matriz nula. 

(b) B é triangular inferior, porque os blocos acima da diagonal são matrizes nulas. 

(c) Cé diagonal, porque os blocos acima e abaixo da diagonal são matrizes nulas. 

(d) D não é nem triangular superior nem triangular inferior. Mais que isso, não há partição de D que a faça ser 
triangular superior ou inferior em blocos. 


Problemas Resolvidos 


Soma matricial e multiplicação por escalar 
1 —2 3 3 0 2 
2.1 Dadas 4 = f 5 E e B= E | T encontre 


(a) A+B,  (b)2A-— 3B. 


(a) Somando os elementos correspondentes, obtemos 


4-7 5+1 —6+8 3 62 


4+8= [155 2+0 a l 


(b) Primeiro multiplicamos pelos escalares e só depois efetuamos a soma das matrizes. 


24 gj Ja o =6]) jT A i 
2 -38= | 10 alfa =3 Bi» 7 e 


(Observe que multiplicamos B por —3 e depois somamos, em vez de multiplicar B por 3 e depois subtrair. Em geral, 
isso evita erros.) 


. x y| x 6 4 x+y 
2.2 Encontre x, y, z, tis que3 [1 DE MEIRE 3 | 


Escrevemos cada lado da igualdade como uma única equação, 


3x 3y| | x+4 x+y+6 
3z 3t| |ztt-1 2+3 


Igualando entradas correspondentes, obtemos o seguinte sistema de quatro equações. 


3x=x+4, 3y=x+y+6, 32=2z+t-1, 3t=2t+3 
ou 2x = 4, 2y = 6 +x, 2z=t-1, t=3 


A solução é x = 2, y = 4,z = 1,t = 3. 


2.3 Demonstre os itens (i) e (v) do Teorema 2.1. (i) (A + B) + C =A + (B + C), (v) k(A + B) = kA + kB. 
Suponha que A = [a;], B = [b;Je C = [c,]. A demonstração se reduz a mostrar que são iguais as ij-ésimas 
entradas de cada lado das equações matriciais. [Apenas demonstramos (i) e (v), pois os demais itens do 
teorema são demonstrados de maneira análoga.] 
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(1) A ij-ésima entrada de A + B éa, + b,, portanto, a ij-ésima entrada de (A + B) + Cé(a, + b,) 
a ij-ésima entrada de B + C é b, + c,, portanto, a ij-ésima entrada de A + (B + C) é a, + (b 
para escalares de K, temos 


FC Do outro lado, 
j + Ci). No entanto, 


1 


(a; + b;) +c;=a;+ (b; + c). 


Assim, (A + B) + Ce A + (B + C) têm ij-ésimas entradas idênticas, mostrando que (A + B) + C =A + (B + ©). 

(ii) A ij-ésima entrada de A + B é a; + b;, portanto, a ij-ésima entrada de k(A + B) é Ka; + b;). Do outro lado, as 
ij-ésimas entradas de kA e kB são ka, e kb, respectivamente, portanto, a ij-ésima entrada de kA + kB é ka, + kb, 
No entanto, para escalares de K, temos 


Ka,+ b,) = ka, + kb, 


Assim, k(A + B) e kA + kB têm ij-ésimas entradas idênticas, mostrando que k(A + B) = kA + kB. 


Multiplicação matricial 


4 
3 é: 5 
2.4 Calcule (a) [8, —4, 5] 2 > (b) [6, =l; 7, 5] aN? (c) [3, 8, —2, 4] —1 
-1 6 

2 


(a) Multiplicando as entradas correspondentes e somando, obtemos 


[8,-4,5]| 21=8)+(-9D+5(-1)=24-8-5=11 
-1 


(b) Multiplicando as entradas correspondentes e somando, obtemos 
4 


=9 
[6,-1,7,5]] _} | =24+9 -21 + 10 =22 


2 


(c) Esse produto não está definido quando a matriz linha e a matriz coluna têm número de elementos distintos. 


2.5 Denotemos uma matriz de tamanho r X s por (r X s). Encontre o tamanho dos produtos matriciais que esti- 
verem definidos. 


(a) (2x3)(3 x4), (c) (x2)(3 x1), (e) (4x 4)(3 x3) 
(b) (4x1) x2), (d) (5x2)(2 x3), (© (2x2)(2x4) 


Em cada caso, o produto está definido se os números internos forem iguais e, nesse caso, o tamanho do produto 
será dado pelos números externos na ordem em que aparecem. 


(a) 2x4, (c) Não está definido. (e) Não está definido. 
(b) 4x2, (d) 5x3, (f) 2x4 


; 1 3 2 0 —4 
2.6 Sejam 4 = : 4 | eB= É 2 l Encontre (a) AB, (b) BA. 


(a) Como A é uma matriz 2 x 2 e B é2 x 3, o produto AB está definido e é uma matriz 2 x 3. Para obter as entradas 
2 0 —4 
da primeira linha de AB, multiplicamos a primeira linha [1, 3] de A pelas colunas É | | j | | de B, 


respectivamente, como segue. 


E E alaaa aa 


2 VIER E 


2.7 


2.8 


2.9 


2.10 
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Para obter as entradas da segunda linha de AB, multiplicamos a segunda linha [2, —1] de A pelas colunas de B. 


1 310 HE 11 6 14 
AB = = 
> 4 5 =) ] , 3 0+2 -8-6 


Assim, 


(b) O tamanho de B é2 x 3e0 de A é2 x 2. Os números internos 3 e 2 não são iguais, portanto, o produto BA não está 
definido. 


ED 2i 0g 
Encontre AB, onde 4 = | 4 2 J e B=|1 3 —5 1 
4 1 =2 2 


Como A é uma matriz 2 x 3e Bé3 x 4, o produto AB está definido e é uma matriz 2 x 4. Multiplicamos as linhas 
de A pelas colunas de B para obter 


4+3-4 2+9 
AB | 4-6 


8-2 +20 


Encontre (a) | JE? (b) BE J (c) e-nl F 


(a) O primeiro fator é 2 x 2 e o segundo é 2 x 1, portanto, o produto está definido como uma matriz 2 x 1. 


a Rea 


(b) O produto não está definido, porque o primeiro fator é 2 x 1e o segundo fator é 2 x 2. 


15+2 1243 e 6 —13 A 


(c) O primeiro fator é1 x 2e o segundo é 2 x 2, portanto, o produto está definido como uma matriz linha 1 x 2. 
1 6 
2,—7] 3 s|= 2+21, 12-35] = [23,-23] 


Certamente 04 = 0 e AO = 0, onde O indica matrizes nulas (de tamanhos possivelmente distintos). Encontre 
matrizes A e B sem entradas nulas tais que AB = 0. 


12 6 2 x “|0 0 
Basta tomar 4 = |; J e sel 1 l-Emao48 = [0 GE 


Demonstre o item (i) do Teorema 2.2: (AB)C = A(BC). 
Sejam A = [a,], B = [by], C = [cu] € AB = S = [s], BC = T = [tj]. Então 


No produto de S = AB por C, a il-ésima entrada de (AB)C é 


n n m 
Sacu + Soc + + SnCu = Do Sikca = 5 > (ayb) Cu 
k=1 k=1j=1 
Por outro lado, no produto de A por T = BC, a il-ésima entrada de A(BC) é 
m m n 
aty + anty +: + antar =D ajta =D, >, ay(bkcu) 
j=l j=1 k=1 


Essas duas somas são iguais, ou seja, a il-ésima entrada de (AB)C é igual à de A(BC). Assim, (AB)C = A(BC). 
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2.11 Demonstre o item (ii) do Teorema 2.2: A(B + ©) = AB + AC. 
Sejam A = [a;], B = [b], C = [c] € B + C = D = [d;], AB = E = [e], AC = F = [f}]. Então 


m 


m 
dj = bik + Co => Ajbjk, Ju =) AjCjk 
ja HA 
Assim, a ik-ésima entrada da matriz AB + AC é 
m m m 
ex + fik = D a;jbik F D GjjCjk = e Alb E Cj) 
j=l j=l j=l 
Por outro lado, a ik-ésima entrada da matriz AD = A(B + C) é 
m m 
And + andis + eo + Aim mk =D, ajd = ay lbie + cj) 
A = 


Assim, A(B + C) = AB + AC, pois as entradas correspondentes são iguais. 


Transposta 


2.12 Encontre a transposta de cada matriz. 


E g 1 2 3 2 
a=]; E)! B=|2 4 5|, C=[1,-3,5,-7], D= | —4 
3 5 6 6 


Reescrevemos as linhas de cada matriz como colunas para obter as transpostas das matrizes. 


1 T 1 2 3 E 
A = —2 8 , Br = 2 45 , œ = 5|' D” = [2, —4, 6] 
3 —9 3 5 6 7 


(Observe que B” = B e, portanto, B é dita simétrica. Observe, também, que a transposta do vetor linha C é um vetor 
coluna e que a transposta do vetor coluna D é um vetor linha.) 


2.13 Demonstre o item (iv) do Teorema 2.3: (AB) = B'A". 
Sejam A = [a;]e B = [b,]. Então a ij-ésima entrada de AB é 
ajbi; F dpbo; Asa Aimbmj 
Essa é a ji-ésima entrada (ordem invertida) de (AB)”. Agora a coluna j de B se torna a linha j de B” e a linha i de A se 
torna a coluna i de A”. Logo, a ij-ésima entrada de B'A” é 
T 
[bij bajs -+ Dmjllai Go -3 Aim] = bijaa + byan + eee + Dajdim 


Assim, (AB)” = B'A”, pois as entradas correspondentes são iguais. 


Matrizes quadradas 


2.14 Encontre a diagonal e o traço de cada matriz dada. 


1 3 6 2 4 8 

() 4=|2 -5 8|, 6d) B=| 3 79|), (o gal 
4 -2 9 =5 0 2 

(a) A diagonal de A consiste nos elementos entre o canto superior esquerdo de A e o canto inferior direito de A ou, em 


outras palavras, nos elementos a,,, 4», 433. Assim, a diagonal de A consiste nos números 1, —5 e 9. O traço de A é a 
soma dos elementos diagonais. Assim, 


1 2 =3 
4 -5 6| 


t(A)=1-5+9=5 
(b) A diagonal de B consiste nos números 2, —7 e 2. Assim, 


(B) =2-7+2=-3 
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(c) Só se define diagonal e traço de matrizes quadradas. 


12 
4 -3 


a82, (DA, (DIA), (A gA). 
2 e! 2d 24 0. |1+8 2-6] 9 —4 
AAA -44= [4 EE l-i 12 s19/-| 8 E 
304,20 |1 2 9 4) | 9—16 4434) 1-7 30 
O =f; lle e la E 
(c) Primeiro substituímos x por A e 5 por 51 em f(x), obtendo 


=. -aj=1 30] ft 2 10 
f(A) = 24 44 +51=2[%9 “ala 3/50 1 


2.15 Sejam 4 = | | fo = 2x — 4x + 5e g(x) =x + 2x + 11. Encontre 


Em seguida, multiplicamos pelos escalares e depois efetuamos a soma matricial. 
—14 60 —4 —8 5 0 —13 52 
Há) = | 120 Ey + a E t o | = | 104 E] 
(d) Substituindo x por A e 11 por 117 em g(x), calculamos 


(A)=4+24-WI= ao Open” 
dd ef 17 4 -3 01 


“La alto -slt cnl=lo o 


Como g(A) é a matriz nula, A é uma raiz do polinômio g(x). 


4 -3 


esses vetores coluna. 


2.16 Seja 4 = | l a | (a) Encontre um vetor coluna não nulo u = H tal que Au = 3u. (b) Descreva todos 


(a) Primeiro montamos a equação matricial Au = 3u e depois escrevemos cada lado como uma única matriz (vetor 


coluna), como segue. 
1 3il] 3% E x+3y | _ |3x 
4 3llyl yP e, então 4x—3y| 13y 


Igualamos as entradas correspondentes para obter um sistema de equações. 


x+3y = 3x 2x—-3y=0 


despido ou 4x—6y=0 ou 2x—3y=0 


Esse sistema reduziu a uma equação linear não degenerada com duas incógnitas, portanto, tem uma infinidade de 
soluções. Para obter uma solução não nula, tomamos, por exemplo, y = 2; então x = 3. Assim, u = (3,2) é um 
vetor não nulo tal que Au = 3u. 

(b) Para obter a solução geral, tomamos y = a, onde a é um parâmetro. Substituindo y = a em 2x — 3y = 0, obtemos 
x = ża, Assim, u = (a, a)” representa todas as soluções. 


Matrizes invertíveis, inversas 


1 0 2 -11 2 2 
2.17 Mostre que 4 = |2 —1 3] e B=| —4 0 1 |sãoinversas. 
4 1 8 6 -1 -l1 


Para isso, calculamos o produto AB 


11+0+12 2+0-2 2+0-2 100 
AB = | —22+4+18 4+0-3 4-1-3|=|0 1 o| =Z 
—44—4+48 8+0-8 8+1-8 001 


Como AB = I, podemos concluir (Teorema 3.18) que BA = 7. Por isso, A e B são inversas. 
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2.18 


2.19 


2.20 


Encontre, caso exista, a inversa de cada matriz dada. 


5 3 2 =3 —2 6 
(a) i=l. I ©) s-h I (0) | 7 T 


Utilize a fórmula da inversa de matrizes de ordem 2 vista na Seção 2.9. 


(a) Primeiro calculamos |A| = 5(2) — 3(4) = 10 — 12 = -2. Em seguida, trocamos de lugar os dois elementos da 
diagonal, trocamos o sinal dos elementos fora da diagonal e multiplicamos por 1/|A|, como segue. 


deb ash 2 =3 = =l 5 
~ 2|—4 5 2 -3 


(b) Primeiro calculamos |B| = 2(3) — (-3)(1) = 6 + 3 = 9. Em seguida, trocamos de lugar os dois elementos da 
diagonal, trocamos o sinal dos elementos fora da diagonal e multiplicamos por 1/|B|, como segue. 


TI 
p- a dd] = 3 3 
9-1. 2 =l, 2 
9 5 
(c) Primeiro calculamos |C| = —2(-9) — 6(3) = 18 — 18 = 0. Como |C| = 0, essa matriz não tem inversa. 
1 1 1 
dj do A3 
Seja4=|0 1 2|.Encontre4 =|» y y3 
124 Ro RENA 


Multiplicando A por A™ e igualando as nove entradas do produto com as nove entradas da matriz identidade 1, obtemos 
o sistema de três equações com três incógnitas seguinte. 


x+ y+ g=1 Xx+ y+ z=0 x+ y+ 2=0 
yı +27 =0 y2 +27 = 1 yz +2z; = 0 
xı + 2y; +47 =0 x, + 2y, +42, = 0 xX; + 2y; + 4z; = 1 


[Observe que a matriz de coeficientes dos três sistemas é A.] 
Resolvendo os três sistemas nas nove incógnitas, obtermos 


x =0, y =2, 2 l; Xx =-2, »=3, z7 =-l; x =l, y =-2, g=1 
0 2 1 
Assim, At=] 2 3 =2 
-1 —1 1 


(Observação: No Capítulo 3 veremos uma maneira eficiente de resolver os três sistemas.) 
Sejam A e B matrizes invertíveis (de mesmo tamanho). Mostre que AB também é invertível e que 
(AB)! = B'A”!. [Assim, por indução, (4443 ---Am) = Am -47 AT] 
Usando a associatividade do produto matricial, obtemos 
(4B)(B7!4A7!) = A(BB DA! = AIAT! = 44! =I 
(B'AT!) (4B) = B! (A7!A)B = A`'IB = BB =1 


Assim, (AB) ' = BA”. 
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Matrizes diagonais e triangulares 


2.21 Escreva em forma matricial as matrizes A = diag(4, -3, 7), B = diag(2, -6) e C = diag(3, -8, 0,5). 


Colocamos os escalares dados na diagonal e completamos com 0. 
4 0 0 
A=|0 -3 0|, B= Al C= eu 
0 0 7 


2.22 Sejam A = diag(2, 3, 5) e B = diag(7, 0, —4). Encontre 
(a) AB,A,B”; (DRA), comf =x +3x-2; (JA4!eB.. 
(a) A matriz produto AB é uma matriz diagonal obtida multiplicando as entradas diagonais correspondentes, ou seja, 
AB = diag(2(7), 3(0), 5(-4)) = diag(14, 0, 20). 
Os quadrados 4” e B° são obtidos tomando o quadrado de cada entrada diagonal, ou seja, 
4? = diag(22,32,52) = diag(4,9,25) e B? = diag(49,0,16) 
(b) HA) é uma matriz diagonal obtida calculando f(x) em cada entrada diagonal de A. Temos 
fQ)=4+6-2=8, f(3)=9+9-2=16, f(5)=25+15-2=38 


Assim, f(A) = diag(8, 16, 38). 
(c) A inversa de uma matriz diagonal é uma matriz diagonal tomando o recíproco de cada elemento diagonal. Assim, 


-1 rio id R : : . 
A~ = diag (5 53) 5) mas B não tem inversa por possuir um 0 na diagonal. 


2.23 Encontre uma matriz A de tamanho 2 X 2 tal que A” seja diagonal, mas não A. 


1 2 7 0 
Tomando 4 = É 1 | temos 42 = k 7 | que é diagonal. 


2.24 Encontre uma matriz triangular superior A tal que £? = | 0 27 


8 E 


Seja 4 = É | Então x = 8, portanto, x = 2 e 7 = 27, portanto, z = 3. Em seguida, calculamos A” usando 


x=2ez=3,obtendo 
A = 2 y||2 y|_ |4 5 E dé 2 y||4 5y| |8 19y 
0 3/0 3 0 9 O 3/0 9 0 27 


. 2 —3 
Assim, 19y = —57, ou y = -3. Isso mostra que 4 = 0 3 | 


2.25 Sejam A = [a,]e B = [b,] matrizes triangulares superiores. Demonstre que AB é triangular superior com 
diagonal à,,D,,, 4,,D5,» <--> AD 


Seja AB = [c,]. Então c; = Fi airb € Ci = Yei 4aipbzi: Suponha que i > j. Então, dado qualquer k, ou i > k, 
ou k > j, portanto, ou ay = 0, ou b,j = 0. Segue que c, = 0 e AB é triangular superior. Suponha que i = j. Então, dado 
qualquer k, de k < i decorre a, = 0 e, de k > i, decorre b,, = 0. Segue que c, = a;b; conforme afirmado. [Isso demonstra 


uma parte do item (i) do Teorema 2.5; as afirmações para A + B e kA são deixadas como exercícios.] 
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Matrizes reais especiais: simétricas e ortogonais 


2.26 Decida se as matrizes dadas são simétricas (ou seja, iguais à sua transposta) ou antissimétricas (ou seja, 


2.27 


2.28 


2.29 


2.30 


iguais ao simétrico de sua transposta). 
a l 0 4 —3 
@ dA=|7 8 2|, bjR=|-4 O 5, ®© G= 
1 2 —4 3 —S 0 
(a) Visualmente, os elementos simétricos (ou seja, imagens espelhadas pela diagonal) de A são-7 e -7,1e1,2€e2. 
Assim, A é simétrica pela igualdade de seus elementos simétricos. 


000 
0 0 0 


(b) Visualmente, os elementos da diagonal são todos nulos e os elementos simétricos de B, a saber, 4 e —4, 3 e 3, 5 e 
—5, são dois a dois simétricos. Assim, B é antissimétrica. 


(c) Como C não é quadrada, C não é nem simétrica nem antissimétrica. 


4 x+2 


2x3 x+] | seja simétrica. Encontre x e B. 


Suponha que B = | 


i 4 
Igualando os elementos simétricos x + 2 e 2x — 3, obtemos 2x — 3 = x + 2, ou x = 5. Logo, B = Ê | 


Seja A uma matriz 2 x 2 real arbitrária. 
(a) Demonstre que se (a, b) for a primeira linha de 4, então @ +b? =le 
a b a b 
a À ou aal E 


(b) Demonstre o Teorema 2.7. Para algum número real 0, temos 


cos0 sen w Ae cos 0 sen 0 
—sen0 cos =~ |sen0 —cos0 


(a) Suponha que (x, y) seja a segunda linha de A. Como as linhas de A constituem um conjunto ortonormal, temos 
+b =l, xX +y =l, ax+by =0 
Analogamente, as colunas constituem um conjunto ortonormal, portanto 


@ +x =], +y =l, ab+xy=0 


Segue que x? = 1 — a? = b?, de modo que x = +b. 
Caso (i): x = b. Então b(a + y) = 0, logo y = —a. 
Caso (ii): x = —b. Então b(y — a) = 0, logo y = a. 

Disso decorre que, conforme afirmado, 


(b) Como a +b = 1, temos -1 <a < 1. Seja a = cos 0. Então b? = 1 — cos? 0, de modo que b =sen 6. Assim 
demonstramos o teorema. 


Encontre uma matriz ortogonal A de tamanho 2 X 2 cuja primeira linha seja um múltiplo (positivo) de (3, 4). 


Normalizando (3, 4), obtemos G : 2), Então, pelo Problema 2.28, 


a 
I| 
[=== 
| 
ve vlw 
vlw vle 
[ARA 
© 
fem 
a 
|l 
TE. 
UE vlw 
| 
vw ve 
Ls 


Encontre uma matriz 3 x 3 ortogonal P cujas duas primeiras linhas sejam múltiplos de u, = (1,1, 1) e 
u, = (0, —1, 1), respectivamente. (Observe que u, e u, são ortogonais, conforme exige a definição de 
matriz ortogonal.) 
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Inicialmente procuramos encontrar algum vetor não nulo u, que seja ortogonal a u, e u,, por exemplo, seu produto 
vetorial us = u, X u = (2, —1, —1). Sejam A matriz de linhas u,, u, e u, e P a matriz obtida de A normalizando cada 
linha. Assim, 


1 1 1 1/vV3 1/73 1/73 
A=ļ|0 -1 1 e P=| 0 -1/2 1/2 
a a. 2/6 -1/V6 —1/v6 


Matrizes complexas: hermitianas e unitárias 
2=3 5+8i 
| b) 4=| -4 3-7 
—6—i 5i 


3-—-Si 2+44i 


H — 
2.31 Encontre A” com (a) A = 647i 1+8i 


Por definição, 47 = AT é a transposta conjugada de A. Assim, 


3+5i 6-7i 2+3i 4 6+i 
A o= dE == 
fade A a Es iaj Pr A aa 3+7i -Si 
1 2: 2. 
373% 3º tê 
2.32 Mostre que 4 = >. 1». |é unitária. 
o» ag 


As linhas de A constituem um conjunto ortonormal, como segue. 


1 SON 22 1A 4 
3 33) da 33) doaram 


Assim, A é unitária. 


2.33 Demonstre o análogo complexo do Teorema 2.6. Seja A uma matriz complexa. As afirmações seguintes são 
equivalentes. (1) A é unitária. (ii) As linhas de A constituem um conjunto ortonormal. (iii) As colunas de A 
constituem um conjunto ortonormal. 


(A demonstração é quase idêntica à fornecida no Exemplo 2.13 para o caso de uma matriz real A de tamanho 3 x 3.) 
Recordemos que os vetores u, Uz, ..., 4, de C” constituem um conjunto ortonormal se forem vetores unitários e dois a 
dois ortogonais segundo o produto escalar de C” definido por 


(a1,42,.:.,4h)- (bi, bz,- bn) =ab; +aby +- + apb 


Seja A uma matriz unitária com linhas R,, R,, ..., R,. Então RT, R7,..., RT são as colunas de A”, Denotemos AA” = 
eita o PT PE 5 

[c;]. Por multiplicação matricial, Cj = RiR; = R;: Rj. Como A é unitária, temos AM” = Multiplicando A por Ate 

igualando cada entrada c, com a correspondente entrada de 7, obtemos as n’ equações seguintes. 


ReRi=1, R-R,=1, ..., R, R,=1, e R R =0,com i£j 


Portanto, as linhas de A são vetores unitários e dois a dois ortogonais, de modo que formam um conjunto ortonormal de 
de T A Ê i 

vetores. Analogamente, a condição A'A = 7 implica que as colunas de A formam um conjunto ortonormal de vetores. 

Além disso, como podemos retornar a cada passo, também valem as recíprocas, demonstrando o teorema. 


Matrizes em blocos 


2.34 Considere as matrizes em blocos (que são partições da mesma matriz) a seguir. 


1 —210 lı 3 |. —210_ 1_ 3 
(a) Bs W aT 
3 114 Si 9 3 1145 9 


E 5 NEN 


Encontre o tamanho de cada matriz em blocos e também o de cada bloco matricial. 


(a) A matriz em blocos tem duas linhas de matrizes e três colunas de matrizes, portanto, é de tamanho 2 x 3. Os blocos 
têm tamanhos 2 x 2,2 x 2e 2 x Ina primeira linhae1 x 2, 1x 2e1 x Ina segunda linha. 
(b) A matriz em blocos tem tamanho 3 x 2 e os blocos têm tamanhos 1 x 3e1 x 2 em cada uma das três linhas. 


2.35 Calcule AB usando multiplicação em blocos, onde 


E F R S 
Aqui, Á = | E B = | | onde E, F, G, R, S e T são os blocos dados e 04 x3 e 04 x3 são matrizes nulas 
0,x> G 01x3 T 


com os tamanhos indicados. Assim, 
9 12 15 3 1 9 12 15 4 
AB = ER ES PEL = É 26 E [| +o| = |19 26 33 7 
Oix GI 0 0 02 
[0 O O] 2 


1 2 1 3 
2.36 Seja M = diag(A, B, C), com 4 = Ê | , B = [5], C = E 3 Encontre M”. 


Como M é diagonal em blocos, elevamos cada bloco ao quadrado 


2/7 10 2 2_ |16 24 
Pal 22 |? B° = [25], CŒ = | 40 64 |’ 
e obtemos 
7 101 
15 21 
2 
M‘ = BD 
116 24 
140 64 


Polinômios matriciais 


2.37 Sejam f(x) e g(x) polinômios e A uma matriz quadrada. Mostre que 
(a) (f +8)(4) =f(4) + 8(4), 
(b) (1-4) = HA)g(4), 
(0) HA)g(4) = g(A) HA). 
Suponha que fo) = ax e go)= De bp. 
(a) Adicionando potências de x com coeficientes 0, podemos supor que r = s = n. Então 


n 


Sœ) + (x) = Da; + bx 


i=l 
n 


Logo, (f +8)(4) = F(a; + b;)A = Dad! E Doa = f(4) + g(4) 


i=] 


(b) Temos f(x)g(x) = 51 a;bx'™. Então 
ij 


FAg(A) = (zaa) (z BA => a;b A = ( fg)(4) 
i J ij 
(c) Usando fx)e(x) = g(x)flx), vemos que 
FAA) = 8A) = (8AA) = 8AA) 
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Problemas Complementares 


Álgebra matricial 


Os Problemas 2.38 a 2.41 se referem às matrizes seguintes. 


1 2 5 0 1 —3 4 3 7 — 
ael, E Eis —6 J =l 6 E del, —8 | 
2.38 Encontre (a) 54 — 2B, (b) 2A + 3B, (c) 20 — 3D. 
2.39 Encontre (a) AB e (AB)C, (b) BC e A(BC). [Lembre que (AB)C = A(BC).] 
2.40 Encontre (a) A? e 4”, (b) AD e BD, (c) CD. 


2.41 Encontre (a) A”, (b) B”, (c) (AB)”, (d) A'B”. [Lembre que ATBT £ (AB)") 


Os Problemas 2.42 e 2.43 se referem às matrizes seguintes. 


2.42 Encontre (a) 34 — 4B, (b) AC, (c) BC, (d) AD, (e) BD, (£) CD. 
2.43 Encontre (a) A”, (b) A'B, (c) A/C. 


1 2 
2.44 Seja 4 = E 6 | Encontre uma matriz B de tamanho 2 x 3 com entradas não nulas e tal que AB = 0. 


a q ds a4 
2.45 Sejam e, = [1, 0, 0], e, = [0, 1, 0], e, = [0,0, 1]e A = | b; b, b, b,|.Encontree A, eA,e;A. 


2.46 Seja e; = [0, ..., 0, 1, 0, ..., O], em que o 1 é a i-ésima entrada. Mostre que 
(a) eA = A, a i-ésima linha de A. (c) Se eA = e,B para cada i, então A = B. 
(b) Be/ = Bi, a j-ésima coluna de B. (d) Se Ae? = Bef para cada j, então A = B. 
2.47 Demonstre os itens (iii) e (iv) do Teorema 2.2: (iii) (A + B)C = AC + BC, (iv) k(AB) = (kA)B = A(kB). 
2.48 Demonstre o Teorema 2.3: (i) (A + B) = A” + B’, (ii) (A = A, (iii) (KA) = KA”. 
2.49 Demonstre as afirmações seguintes. 
(a) Se A tem uma linha nula, então AB tem uma linha nula. 


(b) Se B tem uma coluna nula, então AB tem uma coluna nula. 


Matrizes quadradas, inversas 


2.50 Encontre a diagonal e o traço de cada uma das matrizes seguintes. 
2 =3 8 1 3 —4 
(a) 4=|3 -6 -7|, b) B=|6 1 TI, (0) C= | 


Res 
4 0 =l | 


2 -5 0 
A “2 -5 “4 -2 o |6 —4 
Os Problemas 2.51 a 2.53 se referem às matrizes 4 = E l | yp = | 1 a C= É E ; 
2.51 Encontre (a) A? e 4”, (b) HA) e g(A), onde 
f= R2 S 5, g0) =x — 3x + 17. 
2.52 Encontre (a) B° e B’, (b) f(B) e g(B), onde 


fa) = xk + 2x 22, gx) =x — 3x 6. 


2.55 


2.56 


2.57 
2.58 


A  Árcesra Linear 


Encontre um vetor coluna não nulo v tal que Cv = 4w. 


Encontre a inversa de cada uma das matrizes seguintes (se existir). 


7 4 2 o 4 —6 5 —Q2 
a=[5 sh sefi 5h esl h 2-5] 
112 1 — 1 
Encontreasinverssasde4 = |1 2 5| e B=|0 1 —1 | .[Sugestão: ver Problema 2.19.] 
13 7 1 3 =2 


Suponha que A seja invertível. Mostre que, se AB = AC, então B = C. Dê um exemplo de uma matriz A não 
nula tal que AB = AC, mas B # C. 


Encontre matrizes 2 x 2 invertíveis A e B tais que Æ + B £ 0e A + B não seja invertível. 
Demonstre as afirmações seguintes. 

(a) A é invertível se, e só se, A! é invertível. 

(b) As operações de inversão e transposição comutam, ou seja, (AS = (AS. 


(c) Se A tem alguma linha nula ou coluna nula, então A não é invertível. 


Matrizes diagonais e triangulares 


2.59 


2.60 


2.61 


2.62 


2.63 


2.64 


2.65 


2.66 


Sejam A = diag(1, 2,-3) e B = diag(2, -5, 0). Encontre (a) AB, A” e B”; (b) ÑA), onde fx) = x + 4x — 3; 
(c) A" e B`. 


12 


Sejam 4 = Ê | 


1 1 0 
| e B=|0 1 1|.(a) Encontre 4”. (b) Encontre B”. 
0 01 


Encontre todas as matrizes triangulares reais A tais que 4” = B, com (a) B = Ê . | , (b) B = | : s| 2 


Seja A = lo 1 Encontre todos números k tais que A seja uma raiz do polinômio 


(O) fx =x T+ 10; b) gea) = xX -— 25; (c) ha = x o 4. 
1 


E 30 
26 27! Encontre uma matriz A tal que A` = B. 


Seja B = | 


. Encontre uma matriz triangular A com entradas diagonais positivas e tal que ASB 


AUU 


1 8 
SejaB= |0 9 
0 0 


Usando somente os elementos 0 e 1, encontre o número de matrizes 3 x 3 que sejam (a) diagonais, (b) trian- 
gulares superiores, (c) invertíveis e triangulares superiores. Generalize para matrizes n X n. 


Seja D, = kI a matriz escalar correspondente ao escalar k. Mostre que 
(a) DA = kd, (b) BD, = kB, (c) D; + Dy =] Disk (d) D,Dy = Dyg 
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2.67 Suponha que AB = C, onde A e C são matrizes triangulares superiores. 
(a) Encontre matrizes 2 x 2 não nulas 4, B, C, em que B não seja triangular superior. 


(b) Suponha que A também seja invertível. Mostre que B também deve ser triangular superior. 


Tipos especiais de matrizes reais 


2.68 Encontre x, y, z tais que A seja simétrica, sendo 


2 x 3 7 —6 2x 
(a) 4=|4 5 yl, (b) 4=|y z —2 
z 1 7 x -2 5 


2.69 Seja A uma matriz quadrada. Mostre que (a) A + A” é simétrica, (b) A — A! é antissimétrica, (c) A = B + C, 
em que B é simétrica e C é antissimétrica. 


2.70 Escreva 4 = k 3 


como a soma de uma matriz simétrica B e uma matriz antissimétrica C. 


2.71 Suponha que A e B sejam simétricas. Mostre que as matrizes seguintes também são simétricas. 
(a) A + B, (b) kA, com qualquer escalar k, (c) A’; 
(d) 4”, com n > 0; (e) KA), com qualquer polinômio fx). 


2.72 Encontre uma matriz 2 x 2 ortogonal P cuja primeira linha seja algum múltiplo de 


(a) (3, —4), (b) (1,2) 


2.73 Encontre uma matriz 3 x 3 ortogonal P cujas duas primeiras linhas sejam múltiplos de 


(a) (1, 2, 3) e (0,-2,3), (b) (1,3, De (1, 0, —1). 


2.74 Suponha que A e B sejam ortogonais. Mostre que A”, A! e AB também são ortogonais. 


1 1 
3 —4 1 =2 
2.75 Decida quais das matrizes seguintes são normais. 4 = „B= sC ro 11 
4 3 2 3 001 


Matrizes complexas 
3 x+2i yi 
2.76 Encontre números reais x, y, z tais que A seja hermitiana, com 4 = |3 — 2i 0 l +zi 
yi l=xi =l 


2.77 Suponha que A seja uma matriz complexa. Mostre que AA” e A”A são hermitianas. 


2.78 Seja A uma matriz quadrada. Mostre que (a) A + A” é hermitiana, (b) A — A” é antihermitiana, (c) A = B + 
C, em que B é hermitiana e C é antihermitiana. 


2.79 Decida quais das matrizes seguintes são unitárias. 
1 =i —l+i 


a=] 4/2 vB] pa I l= get q 1 l+i 
[ah EA | | 


2.80 Suponha que A e B sejam unitárias. Mostre que A”, A”! e AB são unitárias. 


2.81 Decida quais das matrizes seguintes são normais. 4 = k P já 2 E a eB = | : : j : 


TU 
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Matrizes em blocos 


2.82 


2.83 


2.84 


2.85 
2.86 


2.87 


1 210 0 0 SE o 

saina 2 4'0 0 

Sejam U = l e V=]|0 011 2 
0 015 1 2 | 

00,341 a 

0 0 1-4 1 


(a) Encontre UV usando multiplicação em blocos. (b) Serão U e V matrizes diagonais em blocos? 


(c) Será UV diagonal em blocos? 


Particione cada uma das seguintes matrizes de tal modo que seja uma matriz quadrada em blocos com o 
maior número possível de blocos na diagonal. 


12000 
1 0 0 3 0000 0 1 0 
A=10 0 2j; B=|0 0 4 0 0|, C=|0 00 
0 03 00500 2 00 
0000 6 
2'0 0'0 1 1'0 0 
Digo 23100 
2 3 o 2 510 U 
Encontre M“ eM'nocaso(a) M = 0!2. 110 (b) M= 00 E 5 
010 0,3 0 0,4 5 


Para cada matriz do Problema 2.84, encontre f(M), sendo f(x) = P+4-s. 


Sejam U = [U,Je V = [V,] matrizes em blocos para as quais esteja definido o produto UV e tais que o nú- 
mero de colunas de cada bloco U, seja igual ao número de linhas de cada bloco V,,. Mostre que UV = [W,), 
com Wy = > Uu Va 


Suponha que M e N sejam matrizes diagonais em blocos tais que blocos correspondentes tenham o mesmo 
tamanho, digamos, M = diag(A)) e N = diag(B)). Mostre que 


G) M +N = diag(A, + B), (ii) MN = diag(AB), 
(11) kM = diag(kA)), Gv) AM) = diag(fA)), para qualquer polinômio fx). 


Respostas dos Problemas Complementares 


Notação A = [R,; R; ...] denota uma matriz A com linhas R,, R,, ... 


238 (a) [-5,10; 27,—34], (œ) [17,4; -12,13 (O) [-7,-27,11; 
239 (a) [-7,14; 39,-28], [21,105,-98; —17,-285,296] 
(b) [5,-15,20; 8,60,-59], [21,105,-98; —17,-285,296] 
240 (a) [7,-6; —9,22], [-11,38; 57,-106); 
(b) [11,-9,17, —7,53,-39], [15,35,-5; 10,-98,69]; 
2.41 (a) 1,3; 2, —4], (b) [5 —6; 0, T; (c) [=7, 39; 14, —28], (d) 
2.42 (a) [-13,-3,18; 4,17,0), (b) [-5,-2,4,5; 11,-3,-12,18], 
(c) [11,-12,0,-5; —15,5,8,4], (dœ [9; 9], (e) [-1; 9, 


—8, 36, —37] 


(c) Não está definido. 


[5,15; 10,40] 


(f) Não está definido. 
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2.43 (a) [1,0; —1,3; 2,4], (b) [4,0,-3; —7,-6,12; 4,-8,6], (c) Não está definido. 
244 [2,4,6; —1,-2,-3] 

2.45 [01,02,03,04]), [bi, b2, b3, bal, [c1 €2, £3, c4] 

250 (3) 2,-6,-1,tr(A)=—5, (b) 1,1,—1,tr(B)=1, (c) Não estão definidos. 

2.51 (a) [-11,-15; 9,-14], [-67,40; —24, 59], (b) [-50,70; —42,-36], g(4) = 0 
2.52 (a) [14,4; —2,34], [60,-52; 26,200], (b) f(B)=0, [-4,10; —5,46] 

253 u = [2a,a]” 

254 [3,-4; —5,7, [-5,% 2,—1],não existe, [1,—-% 2,5] 


2.55 [1,1,—1; 2,—5,3; —1,2,—1], [1,150 —1,—3,1; —1,—4,1] 


256 4=[1,2; 1,2], B= [0,0; 1,1), C= [2,2; 0,0] 

257 A=[1,2; 0,3]; B=[4,3; 3,0] 

2.58 (c) Sugestão: Utilize o Problema 2.48 

2.59 (a) AB = diag(2,-10,0), 4? = diag(1,4,9), B? = diag(4, 25,0); 
(b) f(A) = diag(2,9,-6); (e) 47! = diag(1,3,— 4), não existe C". 

2.60 (a) [1,2n; 0,1], (b) [n,sn(n — 1); 0,1,n; 0,0,1] 


2601 (9) 2,3; 0,5), [-2,-3; 0,-5) [2,-7; 0,-5) [-2,7; 0,5], (b) Nãohá. 


262 (a)k=2,  (bk=-5, (c)Nãohá. 
2.63 [1,0; 2,3] 
2.64 [1,2,1; 0,3,1; 0,0,2] 


2.65 Para uma matriz ser triangular superior, todas as entradas abaixo da diagonal devem ser O e para ser, tam- 
bém, invertível, todos os elementos diagonais devem ser 1. 


(a) 8 (27), (b) 26 (2”(1+1)/2), O 2 (on(n-1)/2) 
267 (a) A=[1,1; 0,0, B=[1,2; 3,4], C = [4,6; 0,0] 
2.68 (a)x=4,y=1,72=3;(b)x=0,y = —6, z qualquer número real. 
2.69 (c) Sugestão: Utilize B=1(A+A7) e C=I(A-A7). 
2.70 B=[4,3; 3,3], C = [0,2; —2,0] 
22 a B- pa (0) [/v5,2/v5; 2/v5,—1/v5] 
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2.73 (a) [1/v14, 2/V14, 3/V14; 0,-2/V13,3/V13; 12/4157, -3/V157, —2/v157] 
(b) [1/v11,3/v11,1/V11; 1/42,0,-1/v2; 3/v22, -2/422, 3/22] 


2.75 AeC 


2.76 x=3,y=0,7=3 


2.78 (c) Sugestão: Utilize B = 1 (4 +4”) e C= 


g 
2.79 As três. 

2.81 A 

2.82 (a) UV = diag([7,6; 17,10]; |[—-1,9; 7,—5)); (b) Não (c) Sim 

2.83 Particione A com uma linha tracejada entre as primeira e segunda linhas (colunas); particione B com uma 


linha tracejada entre as segunda e terceira linhas (colunas) e entre as quarta e quinta linhas (colunas); não há 
como particionar C para torná-la uma matriz quadrada em blocos. 


2.84 (a) M? = diag([4], [9,8; 4,9], [9], 
M? = diag([8], [25,44; 22,25], [27]) 
(b) M? = diag([3,4; 8,11), [9,12; 24,33]) 
M? = diag([11,15; 30,41], [57,78; 156,213]) 


285 (a) diag([7], [8,24; 12,8], [16]), (©) diag([2,8; 16,181], [8,20; 40,48)) 


Sistemas de Equações Lineares 


3.1 INTRODUÇÃO 


Os sistemas de equações lineares desempenham um papel importante e motivador na disciplina de Álgebra Linear. 
Na verdade, muitos problemas de Álgebra Linear se reduzem a encontrar uma solução de um sistema de equações 
lineares. Assim, as técnicas introduzidas neste capítulo serão aplicáveis às ideias abstratas que serão introduzidas 
mais tarde. Além disso, alguns dos resultados abstratos nos proporcionam uma nova perspectiva da estrutura e das 
propriedades de sistemas de equações lineares. 

Todos os nossos sistemas de equações lineares contêm escalares, tanto como coeficientes quanto como cons- 
tantes, e esses escalares podem ser elementos de um corpo K qualquer. Não há praticamente perda de generalidade 
alguma se o leitor supuser que todos os nossos escalares sejam números reais, isto é, elementos do corpo R dos 
reais. 


3.2 DEFINIÇÕES BÁSICAS, SOLUÇÕES 


Nesta seção apresentamos as definições básicas relativas às soluções de sistemas de equações lineares. Os algorit- 
mos que utilizamos para determinar essas soluções só serão tratados adiante. 


Equação linear e soluções 
Uma equação linear nas incógnitas x,, x,, ..., x, é uma equação que pode ser colocada na seguinte forma padrão 
axitax+c+tax,=b (3.1) 


em que a,, a,, ..., a, e b são constantes. Dizemos que a constante a, é o coeficiente de x, e b é o termo constante da 
equação. 

Uma solução da equação linear (3.1) é uma lista de valores para as incógnitas ou, equivalentemente, um vetor 
u de K”, digamos, 


x=hk, xw=h, o, m=k, ou u=(k,h,...,k,) 

tal que seja verdadeira a afirmação seguinte (obtida substituindo x, por k, na equação). 
aik + azko +: + ak, =b 

Nesse caso, dizemos que u satisfaz a equação. 


OBSERVAÇÃO Na Equação (3.1), implicitamente, estamos supondo que há uma ordenação das incógnitas. Para 
evitar o uso de índices, costumamos usar x, y para duas incógnitas, x, y, z para três incógnitas e x, y, z, t para quatro 
incógnitas, que sempre ordenamos dessa forma. 
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Exemplo 3.1 Considere a equação linear nas três incógnitas x, y, z a seguir. 
x+2y—32=6 

Vemos que x = 5, y = 2, z = 1 ou, equivalentemente, o vetor u =(5, 2, 1), é uma solução da equação. Isto é, 
5+22)=3(1)=6 ou 5+4-3=6 ou 6=6 


No entanto, w = (1, 2, 3) não é uma solução, pois, substituindo esses valores, não obtemos uma afirmativa verda- 
deira. 


I+UD-33)=6 ou 1+4-9=6 oœ 4=6 


Sistema de equações lineares 


Um sistema de equações lineares é uma lista de equações com as mesmas incógnitas. Em particular, um sistema de 
m equações lineares L,, L,, ..., L, nas n incógnitas x,, X,, ..., X, pode ser colocado na forma padrão 


am tax + +a=b 


AX + aX + eo + don, = b2 
(3.2) 


em que os a, e os b, são constantes. O número a, é o coeficiente da incógnita x, na equação L, e o número b, é o 
termo constante dessa equação. 

Dizemos que o sistema (3.2) é um sistema m x n (que lemos m por n). O sistema é dito quadrado sem = n, ou 
seja, se o número m de equações for igual ao número n de incógnitas. 

Dizemos que o sistema (3.2) é homogêneo se todos os seus termos constantes forem nulos, isto é, se b, = 0, 
b, = 0,...,b, = 0. Caso contrário, o sistema é dito não homogêneo. 

Uma solução (ou solução particular) do sistema (3.2) é uma lista de valores para as incógnitas ou, de modo 
equivalente, um vetor u de K”, que é uma solução de cada uma das equações do sistema. O conjunto de todas as 
soluções do sistema é denominado conjunto solução ou solução geral do sistema. 


Exemplo 3.2 Considere o sistema de equações lineares a seguir. 
x + xX + 4x3 + 3x4 =5 
2x +3xw» + x3—2x,=1 
x, +2x, — 5x, + 4x —3 


Por ter três equações com quatro incógnitas, o sistema é 3 X 4. Decida se (a) u = (-8,6, 1, De (b) v = (-10,5,1, 
2) são soluções do sistema. 


(a) Substituímos os valores de u em cada equação, obtendo 


-8+6+4D+3(1)=5 ou -8+6+4+3=5 qu 5=5 
2(—8)+3(6)+1-2(1)=1 ou -164+1841-2=1 oq 1=1 
-8 +2(6)—5(1)+4(1)=3 oq -8412-54+4=3 oq 3=3 


Sim, u é uma solução do sistema, pois é uma solução de cada equação. 
(b) Substituímos os valores de u em cada equação, obtendo 


—10+5+4(1)+3(2)=5 ou  -10+5+44+6=5 ou 5= 
2(—10)+3(5)+1-2(2)=1 ou -20+154+1-4=1 oq -8=1 


Não, v não é uma solução do sistema, pois não é uma solução da segunda equação. (Nem precisamos substituir 
v na terceira equação.) 
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Dizemos que o sistema (3.2) é consistente se tiver uma ou mais soluções; se não possuir solução alguma, dize- 
mos que o sistema é inconsistente. Quando o corpo K de escalares é infinito, como, por exemplo, no caso em que 
K é o corpo real R ou o corpo complexo C, vale o seguinte resultado importante. 


Teorema 3.1 Seja K um corpo infinito. Então qualquer sistema .Z de equações lineares tem (i) uma solução, (ii) 
nenhuma solução, ou (iii) uma infinidade de soluções. 


Esta situação é mostrada na Figura 3-1. Os três casos possuem uma interpretação geométrica se o sistema S 
consistir em duas equações com duas incógnitas (Seção 3.4). 


Sistema de equações lineares 
Inconsistentes Consistente 


Sem 
solução 


Matriz de coeficientes e matriz aumentada de um sistema 


Número infinito 
de soluções 


Solução 
única 


Figura 3-1 


Voltemos ao sistema geral (3.2) de m equações com n incógnitas. Associamos a esse sistema duas matrizes, como 
segue. 


ai) i2 ain bı ai) Gg Ain 
mM=|%21 l2 Am b A d=|fa a An 
aml Am2 Amn bn Am1 Am Amn 


Dizemos que a primeira matriz M é a matriz aumentada do sistema e a segunda matriz A é a matriz de coeficientes 
do sistema. 

A matriz de coeficientes é, simplesmente, a matriz dos coeficientes do sistema, sendo igual à matriz aumenta- 
da M do sistema sem a última coluna de termos constantes. É comum usar a notação M = [A, B] para enfatizar as 
duas partes da matriz M, em que B denota o vetor coluna dos termos constantes. A matriz aumentada M e a de co- 
eficientes A do sistema estudado no Exemplo 3.2 são 


11 4 3 5 11 3 
M=|2 3 1 2 1 e A= 12 3 I =2 
1 2 =5 4 3 12 =5 4 


Como era de se esperar, A consiste em todas as colunas de M, exceto a última, que é a coluna dos termos constantes. 

Claramente, um sistema de equações lineares fica completamente determinado por sua matriz aumentada M e 
vice-versa. Mais especificamente, cada linha de M corresponde a uma equação do sistema e cada coluna de M 
corresponde aos coeficientes de uma incógnita, exceto a última coluna, que corresponde aos termos constantes do 
sistema. 


Equações lineares degeneradas 


Uma equação linear é dita degenerada se todos seus coeficientes são nulos, isto é, se ela tem a forma 


0x, + 0x, +- + 0x, =b (3.3) 


A ÁLGEBRA LINEAR 


A solução de uma dessas equações depende apenas do valor da constante b. Mais precisamente, 


Gi) seb £ 0, então a equação não possui solução e 
Gi) se b = 0, então cada vetor u = (k,, k,, ..., k,) de K” é uma solução. 


Vale o resultado seguinte. 
Teorema 3.2 Seja Z um sistema de equações lineares que contém uma equação degenerada L com termo cons- 
tante b. 


Gi) Seb # 0, então o sistema Z não possui solução. 
Gi) Se b = 0, então L pode ser retirada do sistema sem alterar seu conjunto solução. 


A parte (1) decorre da observação que a equação degenerada não possui solução, por isso o sistema também 
não possui solução. A parte (ii) decorre da observação que cada elemento de K” é solução da equação degenerada. 


Incógnita líder numa equação linear não degenerada 


Seja, agora, L uma equação linear não degenerada. Isso significa que um ou mais dos coeficientes de L não são 
nulos. A primeira incógnita de L com coeficiente não nulo é denominada incógnita líder de L. Por exemplo, x, e y 
são as incógnitas líderes, respectivamente, das equações 


0x, + 0x, + 5x3 + 6x4 + Oxs + 8x6 = 7 e 0x +2y —-42=5 
É costume omitir os termos com coeficientes nulos, portanto essas equações seriam escritas como 


5x3 + 6x4 + 8x6 = 7 e 2y—- 42=5 


Nesse caso, a incógnita líder é a que aparece em primeiro lugar. 


3.3 SISTEMAS EQUIVALENTES, OPERAÇÕES ELEMENTARES 


Voltemos ao sistema geral (3.2) de m equações com n incógnitas. Seja L a equação linear obtida multiplicando as 
m equações por constantes c,, Cz, ..., C,» respectivamente, e depois somando as equações resultantes. Mais precisa- 
mente, seja L a equação linear 


(cia E Cm )X1 E Rd (Cam Ed Cmamn)Xn = cib] irf Cmbm 


Dizemos que L é uma combinação linear das equações do sistema. É fácil mostrar (Problema 3.43) 
que qualquer solução do sistema (3.2) é também uma solução da combinação linear L. 


Exemplo 3.3 Sejam L,, L, e L,, respectivamente, as três equações do Exemplo 3.2. Seja L a equação obtida mul- 
tiplicando L, L, e L, por 3, —2 e 4 e somando, ou seja, 


3L: 3x1 + 3x, + 12x3 + 9xy — 15 
—2L,: 4x, 6x, 2x3 4x4 = —2 
(Soma) L: 3x, + 5x, — 10x5 + 29x, = 25 


Então L é uma combinação linear de L, L, e L}. Como se esperava, a solução u = (-8, 6, 1, 1) do sistema também 
é uma solução de L, ou seja, substituindo u em L obtemos uma afirmação verdadeira, a saber, 


3(-8)+5(6) — 10(1) +29(1)=25 ou -244+30-10+29=25 ou 9=9 


Vale o teorema a seguir. 


CaríruLo 3 ° Sistemas DE Eauações LINEARES — TD 


Teorema 3.3 Dois sistemas de equações lineares têm as mesmas soluções se, e só se, cada equação de cada siste- 
ma é uma combinação linear de equações do outro sistema. 


Dois sistemas de equações lineares são ditos equivalentes se possuírem as mesmas soluções. Na próxima subseção 
mostramos uma maneira de obter sistemas equivalentes de equações lineares. 


Operações elementares 
As seguintes operações num sistema de equações lineares L,, L,, ..., L, são ditas operações elementares. 


[E,] Trocar duas equações de posição. Indicamos que as equações L, e L, foram trocadas de posição escrevendo 
“Trocar L, e L, entre si” ou “L; — L;” 


[E,] Substituir uma equação por um múltiplo não nulo dela. Indicamos que a equação L, foi substituída por kL; (com 
k + 0) escrevendo 


“Substituir L, por kL? ou “kL; > L;” 


[E,] Substituir uma equação por um múltiplo de uma outra equação somado com ela mesma. Indicamos que a equação 
L, foi substituída pela soma de kL, e L, escrevendo 


“Substituir L, por kL, + L” ou “kL; + L; > L” 


A seta — em [E,] e [E,] pode ser lida como “substitui”. 


A propriedade principal dessas operações elementares está contemplada no teorema seguinte (demonstrado no 
Exercício 3.45). 


Teorema 3.4 Suponha que um sistema A de equações lineares seja obtido de um sistema Z de equações lineares 
por uma sequência finita de operações elementares. Então M e Z têm as mesmas soluções. 


OBSERVAÇÃO Às vezes (digamos, para evitar frações quando todos os escalares dados são inteiros) podemos 
aplicar [E,] e [E,] num único passo, isto é, podemos aplicar a operação seguinte. 


[E] Substituir a equação L, pela soma de kL, e k Lj (com k’ + 0), que indicamos por 
“Substituir L, por kL; + KL” ou “KL, + KL; =L? 


Enfatizamos que apenas a equação L, é alterada nas operações [E,] e [E]. 


A eliminação gaussiana, nosso principal método para encontrar a solução de um dado sistema de 
equações lineares, consiste no uso das operações que acabamos de apresentar para transformar o 
dado sistema num sistema equivalente cuja solução possa ser obtida com facilidade. 


Os detalhes da eliminação gaussiana são discutidos em seções subsequentes. 


3.4 SISTEMAS QUADRADOS E PEQUENOS DE EQUAÇÕES LINEARES 


Nesta seção consideramos os casos especiais de uma equação com uma incógnita e de duas equações com duas 
incógnitas. Como os conjuntos solução desses sistemas simples podem ser descritos geometricamente e suas pro- 
priedades motivam o caso geral, são tratados separadamente. 


TP  Árcesra Linear 


Equação linear com uma incógnita 


O resultado a seguir é simples e será provado no Problema 3.4. 


Teorema 3.5 Considere a equação linear ax = b. 
G) Sea £ 0, então x = b/a é a única solução de ax = b. 
(ii) Sea = 0, mas b Æ 0, então ax = b não possui solução. 
(ii) Sea = 0 e b = 0, então cada escalar k é uma solução de ax = b. 


Exemplo 3.4 Resolva (a) 4x — 1 = x + 6, (b)2x —5-x=x+3,()4+x—-3=2x+H1I-—x. 

(a) Reescrevemos a equação na forma padrão, obtendo 3x = 7. Então x = zé a única solução [Teorema 3.5(1)]. 
(b) Reescrevemos a equação na forma padrão, obtendo Ox = 8. A equação não possui solução [Teorema 3.5(i1)]. 
(c) Reescrevemos a equação na forma padrão, obtendo Ox = 0. Então cada escalar k é uma solução [Teorema 


3.5(iii)]. 


Sistema de duas equações lineares com duas incógnitas (sistemas 2x2) 


Consideremos um sistema de duas equações lineares não degeneradas nas duas incógnitas x e y, que pode ser colo- 
cado na forma padrão 


Ax + By = C, 


(3.4) 
Ax + Bay = C, 


Como ambas equações são não degeneradas, 4, e B, não são simultaneamente nulos, nem o são A, e B,. 

A solução geral do sistema (3.4) é de um dos três tipos classificados na Figura 3-1. Se R for o corpo de escala- 
res, então o gráfico de cada equação é uma reta no plano R? e os três tipos podem ser interpretados geometricamen- 
te conforme indicado na Figura 3-2. Especificamente, temos os três tipos seguintes. 


(1) O sistema possui exatamente uma solução. 
Nesse caso, as duas retas se intersectam num ponto [Figura 3-2(a)]. Isto ocorre se as retas possuírem inclina- 
ções distintas ou, equivalentemente, se os coeficientes de x e y não forem proporcionais. 


— ou, equivalentemente , AB, — 4,B, £ 0 


Por exemplo, na Figura 3-2(a), 1/3 £ —1/2. 


vA y4 yA 


L e L 


z5: 
L:x-y=-l1 L:x+3y=3 L:x+2y=4 
L:3x+2y=12 L:2x+6y=-8 Ly: 2x + 4y =8 


(a) (b) (c) 


Figura 3-2 
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(2) O sistema não possui solução. 
Nesse caso, as duas retas são paralelas e distintas [Figura 3-2(b)]. Isto ocorre se as retas possuírem a mesma 
inclinação, mas cruzarem o eixo y em pontos distintos, ou seja, 
Angu 


A o B, C 


Por exemplo, na Figura 3-2(b), 1/2 = 3/6 £ —3/8. 

(3) O sistema possui uma infinidade soluções. 
Nesse caso, as duas retas coincidem [Figura 3-2(c)]. Isto ocorre se as retas possuírem a mesma inclinação 
e cruzarem o eixo y no mesmo ponto ou, equivalentemente, se os coeficientes e os termos constantes forem 


proporcionais. 
4 _ B _ € 
4 B Q 


Por exemplo, na Figura 3-2(c), 1/2 = 2/4 = 4/8. 


OBSERVAÇÃO A expressão seguinte e seu valor são denominados determinante de ordem dois. 


= 4,B, — AB; 


Os determinantes serão estudados no Capítulo 8. Assim, o sistema (3.4) possui solução única se, e só se, o determi- 
nante de seus coeficientes não é zero. (Mais adiante, mostraremos que essa afirmação é verdadeira para qualquer 
sistema quadrado de equações lineares.) 


Algoritmo de eliminação 


A solução do sistema (3.4) pode ser obtida pelo processo de eliminação, em que reduzimos o sistema a uma única 
equação com uma única incógnita. Supondo que o sistema possua uma única solução, esse algoritmo de eliminação 
tem duas partes. 


Algoritmo 3.1 É dado um sistema de duas equações lineares não degeneradas L, e L, com duas incógnitas e uma 
única solução. 


Parte A (Eliminação Para Frente) Multiplique cada equação por uma constante para que os coeficientes resultan- 
tes de uma das incógnitas sejam simétricos e, em seguida, some as duas equações, obtendo uma nova equação L 
com apenas uma incógnita. 


Parte B (Substituição Para Trás) Resolva a nova equação L (de apenas uma incógnita), substitua esse valor da 
incógnita em uma das equações originais e resolva-a para obter o valor da outra incógnita. 


A Parte A do Algoritmo 3.1 pode ser aplicada a qualquer sistema, mesmo que o sistema não possua solução 
única. Nesse caso, a nova equação L será degenerada e a parte B não poderá ser aplicada. 
Exemplo 3.5 (Solução Única) Resolva o sistema 
L: 3x+4y= 5 


A incógnita x é eliminada das equações formando a nova equação L = -3L, + 2L,, ou seja, multiplicamos L, 
por -3 e L, por 2 e depois somamos as equações resultantes, como segue. 


3L: 6x + 9y = 24 
2L: 6x + 8y = 10 


Soma : 17y = 34 
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Resolvendo a nova equação em y, obtemos y = 2. Substituímos y = 2 numa das equações originais, digamos, L,, e 
resolvemos na outra variável, x, obtendo 


2x — 3(2) = —8 ou 2x-6=8 ou 2x=-—2 ou x=-l 


Assim, x = —1, y = 2 ou, então, o par u = (—1, 2) é a única solução do sistema. Como 2/3 # —3/4, já estávamos 
esperando que a solução fosse única. [Geometricamente, as retas correspondentes às equações têm interseção no 
ponto (—1, 2).] 


Exemplo 3.6 (Solução não única) 
(a) Resolva o sistema 
L: —2x+6y=5 
Eliminamos x das equações multiplicando L, por 2 e, depois, somando com L,, ou seja, formamos a nova 
equação L = 2L, + L,. Isso fornece a equação degenerada 
Ox + 0y = 13 


em que o termo constante b = 13 é não nulo. Assim, essa equação, e o sistema, não têm solução. Isto era de 
se esperar, pois 1/(—2) = —3/6 # 4/5. [Geometricamente, as retas correspondentes às equações são paralelas e 
não coincidem.] 


(b) Resolva o sistema 
L: x—3y=4 
L: —2x + 6y = —8 
Eliminamos x das equações multiplicando L, por 2 e, depois, somando com L,, ou seja, formamos a nova 
equação L = 2L, + L,. Isso fornece a equação degenerada 
Ox +0y=0 


em que o termo constante é nulo. Assim, o sistema tem uma infinidade de soluções, que correspondem às so- 
luções de cada uma das equações. Isso era de se esperar, pois 1/(—2) = —3/6 = 4/(—8). [Geometricamente, as 
retas correspondentes às equações coincidem. ] 

Para encontrar a solução geral, substituímos y = a em L, para obter 


x— 3a =4 ou x=3a + 4 
Assim, a solução geral do sistema é 
x—-3a=4,y=a ou u = (3a + 4,a) 


em que o parâmetro a é um escalar qualquer. 


3.5 SISTEMAS EM FORMA TRIANGULAR E ESCALONADA 


A eliminação gaussiana, que é o principal método de resolução de sistemas de equações lineares, é tratada na Seção 
3.6. Aqui consideramos dois tipos simples de sistemas de equações lineares, a saber, os triangulares e, mais geral- 
mente, os escalonados. 


Forma triangular 


Considere o sistema de equações lineares em forma triangular a seguir. 
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2x, = 3x, + 5x3 — 2x4, = 9 
5x» — x +3x = 1 
3 


Num sistema em forma triangular, a primeira incógnita x, é a incógnita líder da primeira equação, a segunda incóg- 
nita x, é a incógnita líder da segunda equação e assim por diante. Em particular, o sistema é quadrado e cada incóg- 
nita líder está imediatamente à direita da incógnita líder da equação precedente. 

Um sistema triangular desses sempre possui solução única, que pode ser obtida por substituição para trás, 
como segue. 


(1) Primeiro resolvemos a última equação, para obter x, = 4. 
(2) Em seguida, substituímos esse valor x, = 4 na penúltima equação e resolvemos na penúltima variável x,, como 
segue. 


x —4= xX, = x = 
x, =4=3 ou Tx; = 7 0u% = 1 
(3) Agora substituímos x, = 1 e x, = 4 na segunda equação e resolvemos na segunda variável x,, como segue. 


5» —1+12=1 ou 5x, +11=1 ou 5x, = —10 ou x, = —2 


(4) Finalmente, substituímos x, 2, x, = l ex, = 4 na primeira equação e resolvemos na primeira variável x,, 
como segue. 


2% +6+5-8=9 ou 2x, +3=9 ou 2x, = 6oux,=3 


Assim, x, = 3, x, 2, x, = 1 e x, = 4 ou, equivalentemente, o vetor u = (3, —2, 1, 4) é a única solução do 
sistema. 


OBSERVAÇÃO Existe uma forma alternativa para a substituição para trás (que será utilizada quando resolvermos 
um sistema na forma matricial). A saber, depois de encontrar o valor da última incógnita, substituímos esse valor 
em todas as equações que a precedem antes de resolver a penúltima equação. Isso fornece um sistema triangular 
com uma equação e uma incógnita a menos. Por exemplo, no sistema triangular que acabamos de resolver, substi- 
tuímos x, = 4 em todas as equações anteriores para obter o sistema triangular 


2x1 = 3x, + 5x3 = 17 
5x, — x3=—1 
1x3 — 7 


Então repetimos o processo usando a nova última equação e, assim, sucessivamente. 


Forma escalonada, pivô e variáveis livres 


Dizemos que o sistema de equações lineares seguinte está em forma escalonada. 


2x, + 6x, — x3 + 4x4 — 2x5 = 15 
X3 = 2x4 + 2x5 = 5 
3x4 — 9xs = 6 


Num sistema em forma escalonada, nenhuma equação é degenerada, e a incógnita líder de cada equação a partir da 
segunda está à direita da incógnita líder da equação precedente. As incógnitas líderes das equações do sistema, no 
exemplo, x,, x, € x, são denominadas variáveis pivô e as outras incógnitas, x, e x, no exemplo, são denominadas 
variáveis livres. 

Em geral, um sistema escalonado ou um sistema em forma escalonada é da forma seguinte. 


AX + 2X, + 413X3 + a14X4 + ooo + a, = bi 
aj Xj, Eg a2 j +1%j,+1 Re AnXn = bz (3.5) 
anx; +ectax,=>b 
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ondel <j} <+: <j, eai, aj,- - , Ay são não nulos. As variáveis pivô são x1, X,,...,X;. Observe que 7 <n. 


O conjunto sN de um sistema na é descrito no teorema seguinte (demonstrado no Problema 3.10). 


Teorema 3.6 Considere um sistema de equações lineares em forma escalonada, digamos, de r equações com n 
incógnitas. Há dois casos. 


(1) r= n, ou seja, há o mesmo número de equações e incógnitas (forma triangular). Nesse caso, 
o sistema tem uma única solução. 

Gi) r<n, ou seja, há mais incógnitas do que equações. Nesse caso, podemos atribuir livremente 
valores às n — r variáveis livres e resolver de modo único nas r variáveis pivô, obtendo uma solu- 
ção do sistema. 


Suponha que um sistema escalonado contenha mais incógnitas do que equações. Supondo que o corpo K seja 
infinito, o sistema possui uma infinidade de soluções, porque a cada uma das n — r variáveis livres podemos atri- 
buir qualquer valor escalar. 

A solução geral de um sistema com variáveis livres pode ser descrita de uma de duas maneiras equivalentes, 
que ilustramos usando o sistema escalonado de r = 3 equações e n = 5 incógnitas dado acima. Uma descrição é 
dita “forma paramétrica” da solução e a outra “forma de variáveis livres”. 


Forma paramétrica 


Atribuímos valores arbitrários, denominados parâmetros, às variáveis livres x, e xs, digamos, x = a e x; = b, e 
utilizamos a substituição para trás para obter os valores das variáveis pivô x,, x, € x, em termos dos parâmetros a e 
b, como segue. 


(1) Substituímos x, = b na última equação e resolvemos em x,. 
3x, — 9b = 6 ou 3x, = 6 + 9b ou x, =2 + 3b 
(2) Substituímos x, = 2 + 3b e x, = b na segunda equação e resolvemos em x}. 


x, + 2(2+3b)+2b=5 ou x+4+8b=5 ou x=1-8b 


(3) Substituímos x, = a, x, = 1 — 8b, x, = 2 + 3b e x, = b na primeira equação e resolvemos em x,. 
2x, + 6a — (1 — 8b) + 4(2 +3b) —-2b = 15 ou x, =4-— 3a- 9b 

Assim, a solução geral em forma paramétrica é 
x =4-— 3a- 9b, xX, =a, x, = 1 — 8b, x, =2 + 3b, x; =b 


ou, equivalentemente, v = (4 — 3a — 9b, a, 1 — 8b, 2 + 3b, b), em que a e b são escalares arbitrários. 


Forma de variáveis livres 


Utilizamos a substituição para trás para resolver nas variáveis pivô x,, x, € x, diretamente em termos das variá- 
veis livres pivô x, e x,. Ou seja, a última equação fornece x, = 2 + 3x,, substituindo na segunda equação for- 
nece x, = | — 8x, e substituindo na primeira equação fornece x, = 4 — 3x, — 9x,. Assim, obtemos 


(=4=3% — Ds x, = variável livre, x,=1— 8x, ME 2+3hks x, = variável livre 
ou, equivalentemente, 
v=(4—-3x,— 9x,x, 1 — 825,2 + 3x, X9), 


é a forma de variáveis livres da solução geral do sistema. 
Enfatizamos que não há diferença alguma entre as duas formas da solução geral, sendo a utilização de uma ou 
outra simplesmente uma questão de preferência pessoal. 


OBSERVAÇÃO Uma solução particular do sistema estudado pode ser encontrada atribuindo quaisquer valores às 
variáveis livres e, então, resolvendo nas variáveis pivô com substituição para trás. Por exemplo, tomando x, = 1 e 
xs = 1, obtemos 
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Mm=2+3=5, m=1—-8=—, x=4—-3-9=-8 


Assim, u = (-8, 1, 7,5, 1) é a solução particular correspondente a x, = 1 e x; = 1. 


3.6 ELIMINAÇÃO GAUSSIANA 


O método principal de resolução do sistema de equações lineares (3.2) gerais é denominado eliminação gaussiana 
e consiste, essencialmente, em duas partes. 


Parte A (Eliminação Para Frente) Redução passo a passo do sistema, levando ou a uma equação degenerada sem 
solução (indicando que o sistema não tem solução) ou a um sistema equivalente mais simples em forma triangular 
ou escalonada. 


Parte B (Substituição Para Trás) Substituição para trás passo a passo para obter a solução do sistema mais simples. 


A parte B já foi discutida nas seções precedentes, portanto, basta dar o algoritmo para a Parte A, como segue. 
Algoritmo 3.2 (para Parte A) É dado um sistema m x n de equações lineares (3.2). 


Etapa de eliminação Encontre a primeira incógnita do sistema com um coeficiente não nulo (que agora, obriga- 
toriamente, é x). 

(a) Faça com que ay, É 0, ou seja, se necessário, troque de lugar as equações para que a primeira incógnita x, apareça 
com um coeficiente não nulo na primeira equação. 

(b) Use a,, como um pivô para eliminar x, de todas as equações, exceto a primeira. Em outras palavras, para cada i > 1, 


(1) denote m = —a,/aj; (2) substitua L; por mL, + L; 
Agora, o sistema tem a forma seguinte, 


AX1 + 2X + dy3X3 S ED AinXn 7 b; 


em que x, aparece somente na primeira equação, a4; £ 0e X;, denota a primeira incógnita com um coefi- 
ciente não nulo nas equações depois da primeira. 
(c) Examine cada nova equação L. 


(1) Se L tiver a forma 0x, + 0x, + --- + 0x, = b, com b 0, então 
PARE 


O sistema é inconsistente e não possui solução. 


(2) Se L tiver a forma 0x, + 0x, + --- + 0x, = 0, ou se L for um múltiplo de alguma outra equação, então 
retire L do sistema. 


Etapa de recursão Repita a Etapa de Eliminação para cada novo subsistema “menor” formado por todas as 
equações do sistema, exceto a primeira equação. 


Resultado Ao final, o sistema está reduzido à forma triangular ou escalonada, a menos que tenha sido encontrada 
alguma equação degenerada sem solução, indicando que o sistema é inconsistente. 
As observações a seguir são relativas à Etapa de Eliminação do Algoritmo 3.2. 
(1) Dizemos que o número m dado em (b) é um multiplicador. 
a; coeficiente a ser eliminado 


m = == = 
ail pivô 


(2) Alternativamente, poderíamos também aplicar a operação seguinte em (b). 
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Substituir L, por -a L, + a,L, 


Isto evitaria o aparecimento de frações se todos os escalares, inicialmente, forem inteiros. 


Exemplo de eliminação gaussiana 


Exemplifiquemos em detalhes a eliminação gaussiana usando o sistema de equações lineares seguinte. 


Lı: x—3y—-22= 6 
L: 2x=4y=3z= 8 
Lz: —3x + 6y + 8z = —5 


Parte A Usamos o coeficiente 1 de x na primeira equação L, como o pivô para eliminar x da segunda equação 
L, e da terceira equação L,. Isso é feito como segue. 

(1) Multiplicamos L, pelo multiplicador m = —2 e somamos com L,, ou seja, “substitua L, por -2L, + L,”. 

(2) Multiplicamos L, pelo multiplicador m = 3 e somamos com L,, ou seja, “substitua L, por 3L, + L;”. 


Com esses passos obtemos 


(—2)L;: 2x + 6y + 4z = —12 3L: 3x—9y—6z= 18 
Lz: 2x — 4y- 3z= 8 L; SER EE 
Nova L,: 2y+ z= —4 Nova L3: —3y + 2z = 13 


Assim, o sistema original foi substituído pelo sistema seguinte. 


Li: x=3y=-2z= 6 
L: 27 +Z7== 
Lz: —3y+2z= 13 


(Observe que as novas equações L, e L, formam um subsistema com uma equação a menos e uma incógnita a me- 
nos do que o sistema original.) 
Agora usamos o coeficiente 2 de y na (nova) segunda equação L, como o pivô para eliminar y da (nova) tercei- 
ra equação L,. Isso é feito como segue. 
(3) Multiplicamos L, pelo multiplicador m = že somamos com L,, ou seja, “substitua L, por žl + Lz’. 
(Alternativamente, “substitua L, por 3L, + 2L,”, que evita frações.) 


Com esse passo obtemos 


alo: 3y +22 =- 3L: 6y + 3z = —12 
L:  =3y+2z= 13 u 2L;:  —6y+4z= 26 
Nova L3: Iz= 7 Nova L3: 7z= 14 


Assim, nosso sistema original foi substituído pelo sistema seguinte. 


Li: x—3y—-2= 6 
Lo: 2y+ z= —4 


Lz: 7z= 14 (oułz=7]) 


Agora o sistema está em forma triangular, portanto, completamos a Parte A. 


Parte B Os valores das incógnitas são obtidos na ordem inversa, z, y, x, por substituição para trás, como segue. 


(1) Resolvemos z em L, para obter z = 2. 
(2) Substituímos z = 2 em L, e resolvemos y para obter y = —3. 
(3) Substituímos y = -3 e z = 2 em L, e resolvemos x para obter x = 1. 


Assim, a solução do sistema triangular e, portanto, do sistema original é 


x= l,y=-3,z=2 ou, equivalentemente, u = (1, -—3, 2). 
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Formato condensado 


O algoritmo de eliminação gaussiana envolve reescrever os sistemas de equações lineares. As vezes, podemos evi- 
tar a cópia excessiva de algumas equações utilizando o “formato condensado”. Apresentamos esse formato para a 
solução do sistema precedente. 


Número Equação Operação 
(1) x—3y—-2z= 6 
(2) 2x — 4y- 3z= 8 
(3) —3x + 6y + 8z = —5 
(29 2y+ z=—4 Substitua L, por —2L, + L, 
(3º) — 3y +2z= 13 Substitua L; por3L, + L; 
(3”) 7z= 14 Substitua L, por 3L, + 2L, 


Ou seja, inicialmente escrevemos o número de cada uma das equações originais. Ao aplicar a eliminação gaussiana 
ao sistema, apenas escrevemos as novas equações e as identificamos com o mesmo número da equação original 
correspondente, mas com um apóstrofo. (Após cada nova equação, indicamos, apenas por razões didáticas, a ope- 
ração elementar que forneceu a nova equação.) 

O sistema em forma triangular consiste nas equações (1), (29 e (3'), que são os números com maior número de 
apóstrofos. A substituição para trás nessas equações novamente fornece x = 1, y = 3,7 = 2. 


OBSERVAÇÃO Se duas equações necessitam ser trocadas de lugar, digamos, para obter um coeficiente não nulo 
como um pivô, então isso pode ser facilmente realizado nesse formato, simplesmente renumerando as duas equa- 
ções, em vez de trocar suas posições. 


Exemplo 3.7 Resolva o sistema x+2y-— 32=1 
2x +5y— 82=4 
3x + 8y — 13z = 7 


Resolvemos esse sistema com eliminação gaussiana. 


Parte A (Eliminação Para Frente) Usamos o coeficiente 1 de x na primeira equação L, como o pivô para 
eliminar x da segunda equação L, e da terceira equação L,. Isso é feito como segue. 


(1) Multiplicamos L, pelo multiplicador m = —2 e somamos com L,, ou seja, “substitua L, por -2L, + L;”. 
(2) Multiplicamos L, pelo multiplicador m = —3 e somamos com L,, ou seja, “substitua L, por -3L, + L;”. 


Esses dois passos fornecem 


x+2y—-32=1 Hoeckel 
Fe -2=2 
2y—4z=4 PRE 


(A terceira equação foi suprimida, por ser um múltiplo da segunda equação.) Agora o sistema está em forma esca- 
lonada com variável livre z. 

Parte B (Eliminação Para Trás) Para obter a solução geral, tomamos a variável livre z = a e resolvemos em x e 
y por substituição para trás. Substituindo z = a na segunda equação, obtemos y = 2 + 2a e, substituindo z = ae y 
= 2 + 2a na primeira equação, obtemos 


x+20+2a) —-3a=1 ou x+4+4 —-3a=1 ou x=-3-a 
Assim, a solução geral, em que a é um parâmetro, é 


x=-3-a, y=2+2a, z=a ou u=(3-a,2+2a,a). 
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Exemplo 3.8 Resolva o sistema 
Xi =Æ 3x, = 2x3 E E 5x4 = 4 
2x1 + 8x, — X3 F 9X4 = 9 
3x1 + 5x3 = 12x3 5 17x4 — 7 


Utilizamos eliminação gaussiana. 
Parte A (Eliminação Para Frente) Usamos o coeficiente 1 de x, na primeira equação L, como o pivô para elimi- 
nar x, da segunda equação L, e da terceira equação L,. Isso é feito com as operações seguintes. 
(1) “Substitua L, por -2L, + L,” e (2) “Substitua L, por -3L, + L;”. 
Essas operações fornecem 
x +3x — 2x3 + 5x4 = 4 
2x, + 3x; — x4 = 1 
4x, — 6x, + 2x4 = —5 


Agora utilizamos o coeficiente 2 de x, na segunda equação L, como o pivô e o multiplicador m = 2 para eliminar 
x, da terceira equação L,. Isso é feito com a operação “substitua L, por 2L, + L,”, que, então fornece a equação 
degenerada 


Ox, + 0x, + 0x, +0x, = —3 
Essa equação e, portanto, o sistema original, não possui solução. 
NÃO CONTINUE 


OBSERVAÇÃO 1 Como nos exemplos precedentes, a Parte A da eliminação nos diz se o sistema possui ou não 
uma solução, ou seja, se o sistema é ou não consistente. Assim, a Parte B nunca precisa ser aplicada quando o sis- 
tema não possuir solução. 


OBSERVAÇÃO 2 Se um sistema de equações lineares tiver mais do que quatro equações e quatro incógnitas, 
pode ser mais conveniente usar o formato matricial para resolvê-lo. Esse formato matricial será discutido adiante. 


3.7 MATRIZES ESCALONADAS, FORMA CANÔNICA POR LINHAS, 
EQUIVALENCIA POR LINHAS 


Uma maneira de resolver um sistema de equações lineares é trabalhar, não com o próprio sistema, mas com sua 
matriz aumentada M. Nesta seção introduzimos os conceitos matriciais necessários para isso. Esses conceitos, 
como as matrizes escalonadas e operações elementares por linhas, também têm interesse próprio. 


Matrizes escalonadas 


Dizemos que uma matriz A é escalonada, ou que está em forma escalonada, se valerem as duas condições seguin- 
tes (em que um elemento líder não nulo de uma linha de A significa o primeiro elemento não nulo dessa linha). 


(1) Todas as linhas nulas, se existirem, estão agrupadas juntas nas linhas inferiores da matriz. 
(2) Cada elemento líder não nulo de uma linha está à direita do elemento líder não nulo da linha precedente. 


Ou seja, A = [a;;] é uma matriz escalonada se existirem entradas não nulas 


jo Djs Arj, com Ji LD Er 
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com a propriedade de que 
Di<r, j<ji 
et com f >r l 


As entradas 44; , d5;,...,4,;, que são os elementos líderes não nulos de suas respectivas linhas, são denominadas 
ly Corro Cri, 
pivôs da matriz escalonada. 


Exemplo 3.9 A matriz seguinte é uma matriz escalonada cujos pivôs estão circulados. 


a 

II 
Sooo0o0o 
socol 


Soocouw 
cocos 


Soov 


9 
1 
© 
0 
0 


oxunun 
SANUN 


Observe que os pivôs estão nas colunas C,, C,, C; e C, e que cada um está à direita do que o precede. Usando a 
notação precedente, 


a, =2, ayj, =3, az, = 5, ay, —8 


comj = 2, j, = 4, j; = 6, j, = 7. Aqui, r = 4. 


Forma canônica por linhas 


Uma matriz A é dita em forma canônica por linhas ou, então, em forma escalonada reduzida por linhas, se for uma 
matriz escalonada, ou seja, satisfaz as condições (1) e (2) precedentes e, também, as duas condições seguintes. 


(3) Cada pivô (elemento líder não nulo) é igual a 1. 
(4) Cada pivô é o único elemento não nulo em sua coluna. 


A principal diferença entre uma matriz escalonada e uma matriz em forma canônica por linhas é que, numa 
matriz escalonada, todas as entradas abaixo do pivô são nulas [Propriedades (1) e (2)], mas numa matriz na forma 
canônica por linhas, cada pivô também deve ser igual a 1 [Propriedade (3)] e todas as entradas acima do pivô são 
nulas [Propriedade (4)]. 

As matrizes nula O e identidade 7 de qualquer tamanho são exemplos especiais importantes de matrizes em 
forma canônica por linhas. 


Exemplo 3.10 


As matrizes seguintes são matrizes escalonadas cujos pivôs estão circulados. 


3 20 45 6 

Se E D23 003 00 4 
0 0 Ol, 00000 -3 

e Da a 000 00000 2 

0000 00 0 


A terceira matriz também é um exemplo de uma matriz em forma canônica por linhas. A segunda matriz não 
está em forma canônica por linhas, por não satisfazer a Propriedade (4), já que possui uma entrada não nula acima 
do segundo pivô da terceira coluna. A primeira matriz não está em forma canônica por linhas, por não satisfazer 
nem a Propriedade (3) nem a (4), já que alguns pivôs não são iguais a 1 e há elementos não nulos acima dos pivôs. 
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Operações elementares com as linhas 


Suponha que A seja uma matriz com linhas R,, R,, ..., R„ As seguintes operações sobre A são denominadas opera- 
ções elementares sobre as linhas. 
[E,] (Troca da Ordem de Linhas) Trocar de posição as linhas R, e R,. Isso pode ser escrito como segue. 


“Trocar R, e R; entre si” ou “R; — R?” 


[E,] (Multiplicação de Linha por Escalar) Substituir a linha R, por um múltiplo não nulo kR, da linha R, Isso pode ser 
escrito como segue. 


“Substituir R, por kR, (k #0) ou “kR; > R?” 


[E;] (Soma de Linhas) Substituir a linha R, pela soma de um múltiplo kR, de uma linha R, com a própria linha R,. Isso 
pode ser escrito como segue. 


“Substituir R, por kR, + R?” ou “KR; + R; > R” 


A seta — nas operações E, e E, pode ser lida como “substitui”. 


As vezes (digamos, para evitar frações quando todos os escalares dados são inteiros), podemos aplicar [E,] e 
[E,] num único passo, ou seja, podemos aplicar a operação seguinte. 


[E] Substituir a linha R, pela soma de um múltiplo kR, de uma linha R, com um múltiplo não nulo kK R, da própria linha 
R, Isso pode ser escrito como segue. 


“Substituir R, porkR, + k'R; (K £ 0)” ou SKRARR SR” 


Enfatizamos que nas operações [E,] e [E] somente trocamos a linha R, 


Equivalência por linhas, posto de uma matriz 


Dizemos que uma matriz A é equivalente por linhas a uma matriz B, o que é indicado por 


AB 
se B puder ser obtida a partir de A por uma sequência de operações elementares com as linhas. Se B também for 
uma matriz escalonada, dizemos que B é uma forma escalonada de A. 


Dois resultados básicos sobre a equivalência por linhas são os seguintes. 


Teorema 3.7 Sejam A = [a,]e B = [b,] duas matrizes escalonadas equivalentes por linhas com respectivas en- 
tradas pivô 


aijo aj, rs ayj, e biko bam- Bsk 


s 


Então A e B têm o mesmo número de linhas não nulas, ou seja, r = s, e as entradas pivô estão 
nas mesmas posições, ou seja, j = k jp=h, ...s, jk. 


Teorema 3.8 Toda matriz A é equivalente por linhas a uma única matriz em forma canônica por linhas. 


As demonstrações desses teoremas serão adiadas até o Capítulo 4. A matriz única no Teorema 3.8 é denomina- 
da forma canônica por linhas de A. 
Usando esses dois teoremas, podemos dar nossa primeira definição de posto de uma matriz. 


DEFINIÇÃO O posto de uma matriz A, denotado por pos(A), é igual ao número de pivôs numa forma escalonada 
de A. 


O posto é uma propriedade muito importante de uma matriz e, dependendo do contexto em que 
utilizamos as matrizes, pode ser definido de várias maneiras diferentes. E claro que todas as 
definições sempre dão o mesmo número. 
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Na próxima seção apresentamos a forma matricial da eliminação gaussiana, que determina uma forma escalo- 
nada de qualquer matriz A (e, portanto, o posto de A) e também determina a forma canônica por linhas de A. 


Pode ser demonstrado que a equivalência por linhas é uma relação de equivalência. Isto significa que 


(1) A ~ A, para qualquer matriz 4, 
(2) se A ~ B, então B ~ Ae 
(3) se A ~ BeB ~ C, então A ~ C. 


A propriedade (2) decorre do fato de que cada operação elementar com as linhas tem uma operação inversa do 
mesmo tipo, como segue. 


(1) “Trocar R, e R, entre si” é sua própria inversa. 
(1) “Substituir R, por kR?” e “Substituir R, por (1/k)R?” são inversas. 
(ii) “Substituir R, por kR, + R?” e “Substituir R, por -kR, + R?’ são inversas. 


Para a operação E há um resultado análogo (Problema 3.773). 


3.8 ELIMINAÇÃO GAUSSIANA, FORMULAÇÃO MATRICIAL 


Nesta seção, apresentamos dois algoritmos matriciais que têm os resultados seguintes. 


(1) O algoritmo 3.3 transforma qualquer matriz A numa forma escalonada. 
(2) O algoritmo 3.4 transforma a matriz escalonada em sua forma canônica por linhas. 


Esses algoritmos, que usam as operações elementares com as linhas, são simplesmente reformulações da elimina- 
ção gaussiana aplicada a matrizes em vez de equações lineares. (O termo “reduzir por linhas” ou simplesmente 
“reduzir” significará transformar uma matriz por meio de operações elementares com as linhas.) 


Algoritmo 3.3 (Eliminação para frente) Dada qualquer matriz A, este algoritmo produz uma forma escalonada 
de A, inserindo zeros abaixo de cada pivô, trabalhando de cima para baixo. 


Passo 1 Descubra a primeira coluna com alguma entrada não nula. Seja j, essa coluna. 


(a) Arranje as linhas da matriz de tal modo que a, Æ 0. Em outras palavras, se necessário, troque a 
posição de duas linhas para que na primeira linha tenha uma entrada não nula da coluna j,. 
(b) Use a;; como um pivô para obter zeros abaixo de a,,. 
Mais precisamente, para i > 1, 


(1) Denote m = —a, /ay; (2) Substitua R,pormR, + R; 
[Ou seja, aplique a operação — (a, /ay; )Ry +R; > R$] 


Passo 2 Repita o Passo 1 com a submatriz formada por todas as linhas da matriz exceto a primeira. Para isso, 
seja j, a primeira coluna do subsistema com uma entrada não nula. Assim, ao final do Passo 2, temos 


a, Z 0. 


Passos 3 ar Continue o presente processo até que uma submatriz possua apenas linhas nulas. 


Enfatizamos que, ao final do algoritmo, os pivôs serão 
Aipa Ajs er Ar, 
onde r denota o número de linhas não nulas na matriz escalonada final. 


OBSERVAÇÃO 1 O número m introduzido no Passo 1(b)(1) é denominado multiplicador. 


aij, entrada a ser suprimida 
m = = ER 
aij, pivô 
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OBSERVAÇÃO 2 Se todos os escalares originais forem números inteiros, podemos evitar frações se substituir- 
mos a operação do Passo 1(b) pela seguinte. 


Substituir R, por —a; R; + ay; Ri 


Algoritmo 3.4 (Eliminação para trás) Dada qualquer matriz A = [a,] em forma escalonada com pivôs nas en- 
tradas 


ijo aj,» Peay arj, 
este algoritmo produz a forma canônica por linhas de A. 


Passo 1 (a) (Uso de multiplicação por escalar para igualar o último pivô a 1) Multiplique a última linha não nula 
R,por1/a,;. 


(b) (Uso de a,j, = 1 para obter zero acima do pivô) Para i = r — 1,r — 2, ..., 2, 1, 


(1) Denote m = —a (2) Substitua R; por mR, + R; 


jo 
(Ou seja, aplique a operação —a, R, + R; > R+) 


Passos 2ar-1 Repitao Passo 1 para as linhas R, ,,R,.5,..., Rz 


Passo r (Uso de multiplicação por escalar para igualar o primeiro pivô a 1) Multiplique R, por 1/a1 j 


Existe uma forma alternativa do Algoritmo 3.4 que descrevemos usando apenas palavras. A descrição formal 
desse algoritmo é deixada ao leitor como um problema complementar. 


Algoritmo 3.4 alternativo Coloque zeros acima dos pivôs, linha a linha, de baixo para cima (em vez de coluna a 
coluna da direita para a esquerda). 


Esse algoritmo alternativo aplicado a uma matriz aumentada M de um sistema de equações lineares essencial- 
mente consiste em resolver uma a uma as incógnitas pivô de baixo para cima. 


OBSERVAÇÃO Enfatizamos que a eliminação gaussiana é um processo de dois estágios, como segue. 


ESTÁGIO A (ALGORITMO 3.3) Colocar zeros abaixo de cada pivô, começando com a primeira linha R, e seguin- 
do para baixo. 


ESTÁGIO B (ALGORITMO 3.4) Colocar zeros acima de cada pivô, começando com a última linha R, e seguindo 
para cima. 


Existe mais um algoritmo, o de Gauss-Jordan, que também reduz uma matriz por linhas à sua forma canônica 
por linhas. A diferença é que Gauss-Jordan coloca zeros tanto abaixo quanto acima de cada pivô à medida em que 
começa com a primeira linha R, e segue para baixo. Apesar de Gauss-Jordan poder até ser mais simples de enunciar 
e compreender, é muito menos eficiente do que o algoritmo de eliminação gaussiana de dois estágios. 


1 2 -3 1 2 
Exemplo 3.11 Considere a matriz ÆA = |2 4 —4 6 10 
3 6 —6 9 13 


(a) Use o Algoritmo 3.3 para reduzir A a uma forma escalonada. 

(b) Use o Algoritmo 3.4 para reduzir A até sua forma canônica por linhas. 

(a) Primeiro tomamos a,, = 1 como um pivô para obter zeros abaixo de a,,, ou seja, aplicamos as operações 
“Substituir R, por -2R, + R,” e “Substituir R, por -3R, + R}. Depois usamos a,, = 2 como pivô para obter 
um zero abaixo de a,,, ou seja, aplicamos a operação “Substituir R, por — 5 R, + R3”. Isso fornece 


CaríruLo 3 ° Sistemas DE EQUAÇÕES Lineares — FED 


12 312 12 31 2 
A-|0 0 2 4 6|-|0 0 2 4 6 
00 3 6 7 0 0 0 0 -2 


Agora, a matriz está em forma escalonada. 
(b) Multiplicamos R, por — 1 para obter a entrada pivô a,; = 1 e, então, usamos a,; = 1 como um pivô para obter zeros 
acima dele, usando as operações “Substituir R, por —6R, + R,” e, depois, “Substituir R, por -2R, + Ry”. Isso fornece 


| 2-3 12 12 310 
A-|0 0 24 6|-10 0 2 4 0 
0 0 0 01 00 001 


Multiplicamos R, por } para obter a entrada pivô a,, = 1 e, então, usamos a,, = 1 como um pivô para obter 
zeros acima dele, usando a operação “Substituir R, por 3R, + R,”. Isso fornece 


1 2 -3 1 0 12070 
A-|0 0 12 0|-]0 0120 
00 00 1 00001 
A última matriz é a forma canônica por linhas de A. 


Aplicação a sistemas de equações lineares 


Uma maneira de resolver um sistema de equações lineares é utilizar sua matriz aumentada M em vez das equações 
em si. Mais precisamente, reduzimos M a uma forma escalonada (que nos diz se o sistema possui alguma solução) 
e, depois, voltamos a reduzir M à sua forma canônica por linhas (que, essencialmente, nos dá a solução do sistema 
original de equações lineares). A justificativa desse processo decorre dos fatos seguintes. 


(1) Qualquer operação elementar com as linhas da matriz aumentada M do sistema equivale a aplicar a operação cor- 
respondente ao próprio sistema. 

(2) O sistema tem alguma solução se, e só se, a forma escalonada da matriz aumentada M não possui alguma linha da 
forma (0, 0, ..., 0, b), com b 0. 

(3) O coeficiente de cada variável básica na forma canônica por linhas da matriz aumentada M (exceto nas linhas 
nulas) é uma entrada pivô igual a 1 e esse é o único elemento não nulo da respectiva coluna; logo, a forma de variáveis 
livres da solução do sistema de equações lineares é obtida passando, simplesmente, as variáveis livres para o outro lado 
da igualdade. 


A seguir ilustramos esse processo. 


Exemplo 3.12 Resolva os sistemas seguintes. 


x + x —2x +44 =5 x + x, — 2x, +3x = 4 x+2y+z= 3 

2x, + 2x, — 3x3 + x4=3 2x, + 3x3 + 3x3 — x4 =3 2x + 5y — z = —4 

3x + 3x, — 4x, — 2x, = 1 5x1 + 7x3 + 4x3 + x4=5 3x—2y-z= 5 
(a) (b) (c) 


(a) Reduzimos a matriz aumentada M desse sistema a uma forma escalonada e, depois, à forma canônica por li- 
nhas, como segue. 


1 1 -2 4 5 I. I =2 4 5 1 1 0 —10 —9 
M=|2 2 -3 1 3/-10 0 L TO -T|-|0 0 T =7 =7 
3 3 4 =2 1 0 0 2 -14 -l4 0 0 0 0 0 


Reescrevemos a forma canônica por linhas em termos de um sistema de equações lineares para obter a forma 
de variáveis livres da solução. Isto é, 


x3— Tk = —7 x; = —7 + 7x4 


(Omitimos a linha nula na solução.) Observe que x, e x, são as variáveis pivô e x, e x, são as variáveis livres. 
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(b) Primeiro reduzimos a matriz aumentada M a uma forma escalonada, como segue. 


1 1 -2 3 4 1 1 -2 3 4 1 1 =2 3 4 
M=|2 3 3 -1 3/-|0 1 T =] -S|- 10 1 7 -7 -5 
23 7 4 1 5 0 2 14 -14 -15 0 0 0 0 =5 


Não precisamos continuar até obter a forma canônica por linhas de M, porque a forma escalonada já nos diz 
que o sistema não possui solução. De fato, a terceira linha da matriz escalonada corresponde à equação dege- 
nerada 


Ox, E Ox, ! 0x3 : 0x4 = 5 


que não possui solução. Assim, o sistema não possui solução. 


(c) Reduzimos a matriz aumentada M a uma forma escalonada e depois à forma canônica por linhas, como segue. 


1 2 1 3 1 2 1 3 12 1 3 
M= |2 5 -1 4 | 10 1 -3 10/1/0100 -3 —10 
3 -2 -l1 5 0 -8 —4 —4 0 0 —28 —84 
12 1 3 120 0 1 0 0 2 
“10 1-3 10|-10 I O 1/10 10 -I 
0 0 1 3 0 0 1 3 0 0 1 3 
Assim, o sistema tem a única solução x = 2, y = —1, z = 3 ou, equivalentemente, o vetor u = (2, —1, 3). Ob- 


serve que a forma escalonada de M já indica que a solução é única, pois corresponde a um sistema triangular. 


Aplicação a teoremas de existência e unicidade 


Nesta subseção discutimos as condições teóricas para a existência e unicidade de uma solução de um sistema de 
equações lineares usando o conceito de posto de uma matriz. 


Teorema 3.9 Considere um sistema de equações lineares com n incógnitas e matriz aumentada M = [A, B]. Então 
(a) o sistema possui alguma solução se, e só se, pos(A) = pos(M), 
(b) a solução é única se, e só se, pos(A) = pos(M) = n. 
Demonstração de (a) O sistema tem alguma solução se, e só se, alguma forma escalonada de M = [A, B] não 
possui uma linha no formato 


(0, 0, ..., 0, b), com b £ 0 


Se alguma forma escalonada de M possui uma tal linha, então b é um pivô de M, mas não de A e, portanto, 
pos(M) > pos(A). Caso contrário, as formas escalonadas de A e de M têm os mesmos pivôs e, portanto, pos(A) = 
pos(M), provando (a). 

Demonstração de (b): O sistema possui uma única solução se, e só se, alguma forma escalonada não possui 
variáveis livres. Isso significa que existe um pivô para cada incógnita. Assim, n = pos(A) = pos(M), provando (b). 


Nessa demonstração utilizamos o fato (Problema 3.774) que uma forma escalonada de uma matriz aumentada 
M = [A, B] automaticamente fornece uma forma escalonada de 4. 
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3.9 EQUAÇÃO MATRICIAL DE UM SISTEMA DE EQUAÇÕES LINEARES 


O sistema geral (3.2) de m equações lineares com n incógnitas é equivalente à equação matricial 


x 
an dp ca * bi 
a a sa U b 
AR n ffx | ouù AX=B 
Amı Am2 Amn x Da 


onde A = [a,] é a matriz de coeficientes, X = [x,] é o vetor coluna das incógnitas e B = [b,] é o vetor coluna dos 
termos constantes. (Em alguns livros pode ser encontrada a equação Ax = b em vez de AX = B, para enfatizar que 
xe b são, simplesmente, vetores coluna.) 

Afirmar que o sistema de equações lineares e a equação matricial são equivalentes significa que qualquer vetor 
solução do sistema é uma solução da equação matricial e vice-versa. 


Exemplo 3.13 São equivalentes o sistema de equações lineares e a equação matricial seguintes. 


x, + 2x, — 4x3 + 7x4 = 4 1 2 —4 7 $ 4 

3x1 = 5x, + 6x3 — 8x4 = 8 e 3 —5 6 —8 o = 

4x, — 3x3 — 2x; + 6x4 = 11 fd dll. 11 
4 


Observe que x, = 3, x, = 1, x, = 2, x, = 1 ou, equivalentemente, o vetor u = [3, 1, 2, 1] é uma solução do 
sistema. Assim, o vetor (coluna) u também é uma solução da equação matricial. 
A forma matricial AX = B de um sistema de equações lineares é muito conveniente em termos de escrita 


quando discutimos e demonstramos propriedades de sistemas de equações lineares. Exemplificamos isso com 
nosso primeiro teorema (descrito na Figura 3-1), que reformulamos como segue. 


Teorema 3.1 Seja K um corpo infinito. Então o sistema AX = B tem (a) uma única solução, (b) nenhuma solução, 
ou (c) uma infinidade de soluções. 


Demonstração Basta demonstrar que, se AX = B tiver mais do que uma solução, então terá uma infinidade de 
soluções. Suponha que u e v sejam soluções distintas de AX = B, ou seja, que Au = B e Av = B. Então, dado qual- 
quer r de K, 


Aļ[u + r(u — v)] = Au + r(Au — Av) = B + r(B — B) = B 


Assim, para cada r de K, o vetor u + r(u — v) é uma solução de AX = B. Como todas essas soluções são distintas 
(Problema 3.47), AX = B possui uma infinidade de soluções. 


Observe que esse teorema é verdadeiro se K for o corpo dos números reais R (ou o corpo complexo C). Na 
Seção 3.3 mostramos que esse teorema tem uma interpretação geométrica se o sistema consistir em duas equações 
com duas incógnitas, em que cada equação representa uma reta em R°. O teorema também tem uma interpretação 
geométrica se o sistema consistir em três equações não degeneradas com três incógnitas, em que as três equações 
representam planos H,, H, e H, em Rº, como segue. 


(a) Solução única Os três planos se cortam exatamente num ponto. 

(b) Nenhuma solução Os planos podem se intersectar dois a dois, mas não possuir ponto comum de interseção, ou dois 
dos planos podem ser paralelos e distintos. 

(c) Uma infinidade de soluções Os três planos podem se intersectar numa reta (uma variável livre) ou coincidem (duas 
variáveis livres). 


Os três casos estão ilustrados na Figura 3-3. 


Equação matricial de um sistema de equações lineares quadrado 


Se a matriz A de coeficientes for quadrada, dizemos que o sistema de equações lineares AX = B é quadrado. Nesse 
caso, temos o resultado importante seguinte. 
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(a) Solução única (c) Uma infinidade de soluções 


A 


(1 (ii) (iv) 


(b) Nenhuma solução 


Figura 3-3 


Teorema 3.10 Um sistema quadrado AX = B de equações lineares tem uma única solução se, e só se, a matriz A 
2. 4 -1 2 2... = . 
é invertível. Nesse caso, A B é a única solução do sistema. 
. : 4 = -1 4 2: = : 4 x 
Aqui apenas demonstramos que se A for invertível, então A B é a única solução. Se A for invertível, então 


A(A'B) = (AAB = IB = B 
e, portanto, A™'B é uma solução. Seja, agora, v uma solução qualquer, ou seja, Av = B. Então 
v=Iv=(ATA)v=A4"(Av) = A'B 


: = -1 24 
Assim, a solução A B é única. 


Exemplo 3.14 Considere o seguinte sistema de equações lineares, com matriz de coeficientes A e inversa AM 
também dadas. 


x+2y+ 32=1 12 3 3 -8 3 
x+3y+ 6z=3, A=|1 3 6l, A= be 7 = 
2x +6y+13z=5 2 6 13 0 —2 q 


Pelo Teorema 3.10, a única solução do sistema é 


3 -8 3]ļ]f1 =b 
AlB=[|-1 7 -3||3]=| 5 
0 -2 ılļlļ5 =Í 


Isto é, x = —6, y = 5, z = -—l1. 


OBSERVAÇÃO Enfatizamos que, em geral, o Teorema 3.10 não nos ajuda a encontrar a solução de um sistema 
quadrado. Isso ocorre porque, em geral, encontrar a inversa de uma matriz de coeficientes A não é mais fácil do 
que resolver o sistema diretamente. Assim, a menos que nos seja dada a inversa de uma matriz de coeficientes A, 
como no exemplo precedente, resolvemos um sistema quadrado usando a eliminação gaussiana (ou algum método 
iterativo cuja discussão está fora dos objetivos deste texto.) 
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3.10 SISTEMAS DE EQUAÇÕES LINEARES E COMBINAÇÃO LINEAR DE VETORES 


O sistema geral (3.2) de equações lineares pode ser reescrito como a equação vetorial seguinte. 


a 2 Tn bı 

a a a b 
xı 21 +x 22 desen 2n | — 2 

Am1 Am2 Amn bm 


Lembre que um vetor v de K” é dito uma combinação linear dos vetores u,, u,, ..., u, de K” se existirem escalares 
Ay, áz, -.., 4, em K tais que 


V = au, + au, + + amum 


Em vista disso, o sistema geral (3.2) de equações lineares e a equação vetorial equivalente dada têm alguma solu- 
ção se, e só se, o vetor coluna dos termos constantes é uma combinação linear das colunas da matriz de coeficien- 
tes. Enunciamos essa observação formalmente. 


Teorema 3.11 Um sistema AX = B de equações lineares possui alguma solução se, e só se, B é uma combinação 
linear das colunas da matriz de coeficientes A. 

Assim, o problema de expressar um dado vetor v de K” como uma combinação linear de vetores u,, Uz, ..., 4, de 
K” se reduz à resolução de um sistema de equações lineares. 


Exemplo de combinação linear 
Digamos que queiramos expressar o vetor v = (1, —2, 5) como uma combinação linear dos vetores 
u = (1,1,1), u = (1,2,3), us = (2,—1,1) 


Começamos escrevendo v = xu, + yu, + zu, com incógnitas x, y, z e depois encontramos o sistema de equações 
lineares equivalente que resolvemos. Mais precisamente, primeiro escrevemos 


1 1 1 
—2 | =x| 1| +y|2| +z|-—1 =) 
5 1 3 1 
Então 
l x y 2z x+y+2z 
—2|=|xl+|2y|+|-z|=|x+4+2y—z (E) 
5 x 3y Z x+3y+z 


Igualando entradas correspondentes, obtemos o sistema equivalente 


x+ y+2= 1 
x+2y— z=—2 
x+3y+ z= 5 


Por conveniência notacional, escrevemos os vetores de R” como colunas, porque dessa forma é mais fácil encontrar 
o sistema de equações lineares equivalente. De fato, é fácil ir diretamente da equação vetorial (*) para o sistema 


Agora resolvemos o sistema de equações lineares equivalente por redução à forma escalonada. Isso fornece 


x+ y+22= 1 x+y+2z2= 1 
y—32=-3 e, então, y — 3z = —3 
2y— z= 4 5z= 10 


Uma substituição para trás fornece a solução x = —6, y = 3, z = 2. Assim, v = —6u, + 3u, + 2u. 
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Exemplo 3.15 
(a) Escreva o vetor v = (4,9, 19) como uma combinação linear de 
ui = (1, —2,3), u, = (3, —7, 10), us = (2,1,9). 


Encontramos o sistema de equações lineares equivalente escrevendo v = xu, + yu, + zu, e reduzimos o 
sistema por redução à forma escalonada. Temos 


x+ 3y+2z= 4 x+3y+2z= 4 x+3y+2z= 4 
=x = D+ z= 9 ou —y+52=17 ou —y+52=17 
3x + 10y + 9z = 19 y+3z2= 7 8z = 24 


A substituição para trás fornece a solução x = 4, y = —2, z = 3. Assim, v é uma combinação linear de u,, u,, us. 
Mais precisamente, v = 4u, — 2u, + 3u. 
(b) Escreva o vetor v = (2, 3, —5) como uma combinação linear de 


u = (23), u = (2,3, —4), uz = (1,3, —5) 


Encontramos o sistema de equações lineares equivalente escrevendo v = xu, + yu, + zu, e reduzimos o 
sistema por redução à forma escalonada. Temos 


x+2y+ z= 2 x+2y+ z= 2 x+2y+ z= 2 
2x+3y+32= 3 ou —y + z=—1 ou — 5y+52=—1 
3x— 4p- 52=—S5 2y—-22= 1 0= 3 


Esse sistema não tem solução. Assim, é impossível escrever v como uma combinação linear de u,, u, U,. 


Combinações lineares de vetores ortogonais, coeficientes de Fourier 


Inicialmente revemos (Seção 1.4) que o produto escalar u - v dos vetores u = (a,,a,, ..,a)ev = (b, bz, ..., b,) de 
R” é definido por 


u- v = dibi + aby +55: t abn 


Além disso, os dois vetores u e v são ditos ortogonais se seu produto escalar for nulo, u - v = 0. 
Suponha que u,, u, ..., u, de R” sejam n vetores não nulos dois a dois ortogonais. Isso significa que 
1 2 n 


(i) uw:u=0 comi fj e (ii) uu; £0 para cada i 


Então, para qualquer vetor v de R”, existe uma maneira simples de escrever v como combinação linear de u,, u,, ..., 
u, que apresentamos no exemplo seguinte. 


Exemplo 3.16 Considere os três vetores de RÊ. 

u = (1,1,1), u, = (1,-3,2), us =(5,-1,-4) 
Esses vetores são dois a dois ortogonais, ou seja, 

u u, =1—-3+2=0, u u; =5—1-—4=0, u:uy=5+3-8=0 
Suponha que queiramos escrever v = (4, 14, -9) como combinação linear de u,, u,, us. 


Método 1 Encontre o sistema de equações lineares equivalente, como no Exemplo 3.14 e resolva-o, encon- 
trando v = 3u, — 4u, + us. 


Método 2 (Neste método usamos a ortogonalidade dos vetores u,, u,, u, €, por isso, é muito mais simples.) 
Escreva v como combinação linear de u, u,, u, usando escalares x, y, z a determinar, como segue. 


(4,14,-9) = x(1,1, 1) +y(1,-3,2) +z(5, —1, —4) (*) 


CaríruLo 3 ° Sistemas DE EQuaçõES Lineares — FD 


Tomando o produto escalar de (*) com u,, obtemos 
(4,14,-9) - (1,1,1) =x(1,1,1)- (1,1,1) ou 9=3x o è x=3 


(As duas últimas parcelas do produto escalar desaparecem porque u, é ortogonal a u, e a u,.) Tomando, em 
seguida, o produto escalar de (*) com u,, obtemos 


(4,14, —9) - (1, —3,2) = y(1, —3, 2) - (1, —3, 2) ou — 56 = 14y ou y=-—4 
Finalmente, tomando o produto escalar de (*) com u,, obtemos 


(4,14,-9)-(5,-1,-4)=z(5,-1,-4)-(5,-1,-4) ou 42=42 qu z=1 


Assim, v = 3u, — 4u, + us. 


O procedimento do Método 2 é válido em geral, como segue. 


Teorema 3.12 Sejamu,, u, ..., u, vetores não nulos dois a dois ortogonais de R”. Então, para qualquer vetor v de 
R” 
u= ui ys us 


v = uy + us + 
uu uy ` U2 


& 


Un ` Un 


Enfatizamos que precisamos de n tais vetores ortogonais u, de R” para poder usar a fórmula. Observe, também, 
que cada u; - u; # 0, por ser u; um vetor não nulo. 


OBSERVAÇÃO Dizemos que os escalares que aparecem no Teorema 3.12 são os coeficientes de Fourier de v. 
Mais precisamente, o coeficiente de Fourier de v em relação a u, é 


Vu Vu; 


uu ul) 


i 


Esses coeficientes são análogos aos famosos coeficientes da série de Fourier de uma função. 


3.11 SISTEMAS HOMOGÊNEOS DE EQUAÇÕES LINEARES 


Um sistema de equações lineares é dito homogêneo se todos os seus termos constantes forem nulos. Assim, um 
sistema homogêneo tem a forma AX = 0. Claramente, tais sistemas sempre têm o vetor nulo O = (0, 0, ..., 0) como 
uma solução, denominada solução nula ou trivial. Por isso, geralmente estamos interessados em saber se esses 
sistemas têm, ou não, alguma solução não nula. 

Como o sistema homogêneo AX = 0 tem, pelo menos, a solução nula, sempre pode ser colocado em forma 
escalonada, digamos, 


1X + AX + d13X3 + A4X4 gese AinXn 7 0 
aaj, Xj, + doa E F dont = 0 


Aqui, r denota o número de equações na forma escalonada e n denota o número de incógnitas. Assim, o sistema 
escalonado tem n — r variáveis livres. 
A questão de soluções não nulas se reduz aos dois casos seguintes. 


(1) r= n. O sistema só tem a solução nula. 
(i) r< n. O sistema tem alguma solução não nula. 


Por isso, começando com menos equações do que incógnitas, temos r < n na forma escalonada e o sistema terá 
alguma solução não nula. Isso demonstra o resultado importante a seguir. 


Teorema 3.13 Um sistema homogêneo AX = 0 com mais incógnitas do que equações tem alguma solução não 
nula. 
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Exemplo 3.17 Decida se os sistemas homogêneos dados têm ou não solução não nula. 


x+ y= z=0 x+ y— z=0 x, + 2x, — 3x3 + 4x, = 0 

2x—-3y+ z=0 2x+4y— z=0 2x, — 3x, + 5x4 — 7x, = 0 

x—4y+22=0 3x+2y+22=0 5x1 + 6x, — 9x3 + 8x4 = 0 
(a) (b) (c) 


(a) Reduzimos o sistema à forma escalonada, como segue. 


x+ y— z=0 
—5y+32=0 e, então, 
—5y+32=0 


x+ y— z=0 
—5y+32=0 


Esse sistema tem uma solução não nula porque a forma escalonada tem somente duas equações nas três variá- 
veis. Aqui, z é uma variável livre. Tomando, digamos, z = 5, a substituição para trás dá y = 3 ex = 2. Assim, 
o vetor u = (2,3, 5) é uma solução não nula específica. 


(b) Reduzimos o sistema à forma escalonada, como segue. 


x+y— z=0 x+y-z=0 
2y+ z=0 e, então, 2y+z=0 
=y + 5z=0 liz=0 


A forma escalonada tem três equações com três variáveis. Assim, o sistema só tem a solução nula. 


(c) O sistema precisa ter alguma solução não nula (Teorema 3.13) porque há quatro incógnitas, mas só três equa- 
ções. (Aqui não precisamos reduzir o sistema a uma forma escalonada.) 


Base para o conjunto solução de um sistema homogêneo 


Seja W o conjunto de todas as soluções de um sistema homogêneo AX = 0. Uma lista u,, u, ..., u, de vetores solu- 
ção não nulos do sistema é uma base de W se cada vetor solução w € W pode ser expresso, de maneira única, como 
uma combinação linear dos vetores u, U, ..., U, OU Seja, se existem escalares únicos a,, q, ..., a, tais que 


w = aiU + azu +: + aU 


O número s de tais vetores da base é igual ao número de variáveis livres. Este número s é dito a dimensão de 
W, que denotamos por dim W = s. Caso W = {0}, ou seja, se o sistema possuir apenas a solução nula, definimos 
dim W = 0. 

O teorema seguinte, demonstrado no Capítulo 5, nos diz como determinar uma tal base. 


Teorema 3.14 Seja W o conjunto das soluções de um sistema homogêneo AX = 0 e suponha que a forma es- 
calonada do sistema homogêneo tenha s variáveis livres. Sejam u,, u,, ..., u, as soluções obtidas tomando uma 
das variáveis livres como 1 (ou qualquer outra constante não nula) e as demais variáveis livres como 0. Então 
dim W = seu, W, ...,u, formam uma base de W. 


Enfatizamos que o conjunto das soluções W pode ter muitas bases e que o Teorema 3.14 apenas dá uma delas. 


Exemplo 3.18 Encontre a dimensão e uma base do conjunto solução W do sistema homogêneo 
Xi + 2x, = 3x3 + 2x4 = 4xs — 0 
2x1 + 4x, = 5x3 + X4 = 6x5 = 0 
5x, + 10x, — 13x3 + 4x4 — 16x; = 0 
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Primeiro reduza o sistema a uma forma escalonada, aplicando as operações seguintes. 
“Substituir L, por -2L, + L”, “Substituir L, por -5L, + L;” e, depois, “Substituir L, por -2L, + L,” 
Essas operações fornecem 
x, + 2x, — 3x3 + 2x4 — 4x5 = 0 


x3 — 3x4 + 2x; = 0 e 
2x3 — 6x4 + 4x5 =0 


xı + 2x — 3x3 + 2x4 — 4x; = 0 
x3 — 3x4 + 2x; = 0 


O sistema em forma escalonada tem três variáveis livres, x,, x, € xs, portanto, dim W = 3. Três vetores solução que 


formam uma base de W são obtidos como segue. 


(1) Tomamos x, = 1, x, = 0 e x, = 0. Substituição para trás fornece a solução v, = (-2, 1,0,0,0). 
(2) Tomamos x, = 0, x, = 1 e x, = 0. Substituição para trás fornece a solução v, = (7, 0,3, 1, 0). 
(3) Tomamos x, = 0, x, = 0 e x, = 1. Substituição para trás fornece a solução v, = (-2, 0, —2, O, 1). 


Os vetores solução v, = (-2, 1, 0, 0, 0), v, = (7, 0, 3, 1,0), v, = (-2,0,-2,0, 1) formam uma base de W. 
OBSERVAÇÃO Qualquer solução do sistema do Exemplo 3.18 pode ser escrita da forma 


avı + bv, + cv; = a(—2, 1,0,0,0) + b(7,0,3,1,0) + c(-2,0,-2,0,1) 
=(-2a+7b-2c, a, 3hb-2c, b, cœ) 


ou 
xı = —2a + 7b — 2c, X, =a, x; =3b = 2c, Xx =b; x; =C 


em que a, b, c são constantes arbitrárias. Observe que essa representação não é nada mais do que a forma paramé- 
trica da solução geral, com a escolha dos parâmetros x) = a, x4 = b, x5 = C. 


Sistemas não homogêneos e sistemas homogêneos associados 


Seja AX = B um sistema não homogêneo de equações lineares. Dizemos que AX = 0 é o sistema homogêneo asso- 
ciado. Por exemplo, 


x+2y—4z=7 Š x+2y—4z=0 
3x — 5y + 6z = 8 3x — 5y + 6z = 0 


são um sistema não homogêneo e o sistema homogêneo associado. 
A relação entre uma solução U de um sistema não homogêneo AX = B e o conjunto solução W do sistema 
homogêneo associado AX = 0 é dada no teorema seguinte. 


Teorema 3.15 Sejam v, uma solução particular de AX = B e Wo conjunto solução de AX = 0. Então o conjunto 
solução de AX = B é dado por 


U=w+W=(w+w:weW) 


Em outras palavras, U = vo + W é obtido somando v, a cada elemento de W. Observamos que esse teorema 
tem uma interpretação geométrica em R? , como segue. Suponha que W seja uma reta passando pela origem. Então, 
conforme esboçado na Figura 3-4,U = vu, + W é a reta paralela a W obtida pela soma de v, a cada elemento de W. 
Analogamente, se W for um plano pela origem O, então U = vo + W é um plano paralelo a W. 


A Árcesra Linear 


vot W 
W 
Yo 
y 
0 
xX 
Figura 3-4 


3.12 MATRIZES ELEMENTARES 


Sejam e uma operação elementar com as linhas e e(A) o resultado dessa operação a uma matriz A. Seja E a matriz 
obtida pela aplicação de e à matriz identidade 7, ou seja, 


E = el) 


Então E é denominada matriz elementar correspondente à operação elementar e. Observe que E sempre é uma 
matriz quadrada. 


Exemplo 3.19 Considere as operações elementares com as linhas a seguir. 


(1) Trocar R, e R, entre si. (2) Substituir R, por -6R.. (3) Substituir R} por —4R, + R}. 


As matrizes elementares 3 x 3 correspondentes a essas operações elementares com as linhas são 
1 0 0 1 0 0 1 0 0 
E =|0 0 1j, E =|0 —6 0], E, = 0 1 0 
010 0 0 1l —4 0 1 
Temos o teorema seguinte, demonstrado no Problema 3.34. 


Teorema 3.16 Sejam e uma operação elementar com as linhas e E a matriz elementar m x m correspondente. 
Então 


e(A) = EA 
onde À é uma matriz m x n qualquer. 


Em outras palavras, o resultado de aplicar uma operação elementar e nas linhas de A pode ser obtido multipli- 
cando a matriz elementar correspondente E pela matriz 4, nessa ordem. 

Agora suponha que e” seja a operação inversa da operação elementar e e que E' e E sejam as matrizes corres- 
pondentes. Observamos (Problema 3.33) que E é invertível e que E' é sua inversa. Isso significa, em particular, que 
qualquer produto 


P = E... EE, 


de matrizes elementares é invertível. 
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Aplicações de matrizes elementares 


Usando o Teorema 3.16, estamos em condições de provar (Problema 3.35) as seguintes propriedades importantes 
de matrizes. 


Teorema 3.17 Seja A uma matriz quadrada. Então as afirmativas seguintes são equivalentes. 


(a) A é invertível (não singular). 
(b) A é equivalente por linhas à matriz identidade T. 
(c) A é um produto de matrizes elementares. 


Lembre que duas matrizes A e B são ditas inversas se AB = BA = I. O teorema seguinte (demonstrado no Pro- 
blema 3.36) demonstra que só precisamos verificar que um desses produtos é igual à identidade, digamos, AB = J, 
para estabelecer que as matrizes são inversas. 


Teorema 3.18 Suponha que AB = I. Então BA = Te, portanto, B = A`. 


A equivalência por linhas também pode ser definida em termos da multiplicação matricial. Mais precisamente, 
demonstra-se (Problema 3.37) o teorema seguinte. 


Teorema 3.19 B é equivalente por linhas a A se, e só se, existe uma matriz não singular P tal que B = PA. 


Aplicação à obtenção da inversa de uma matriz n x n 


A inversa de uma matriz pode ser encontrada com o algoritmo seguinte. 


Algoritmo 3.5 Dada qualquer matriz A, este algoritmo produz a inversa de A, ou mostra que a inversa não existe. 


Passo 1 Construa a matriz n x 2n (em blocos) M = [A, 1], em que A é a metade da esquerda e a matriz identidade 
I é a metade da direita de M. 

Passo 2 Reduza M por linhas a uma forma escalonada. Se nesse processo surgir uma linha nula na metade A de 
M, então 


PARE 


A não possui inversa. (Caso contrário, A está em forma triangular.) 


Passo 3 Continue reduzindo M à sua forma canônica por linhas 
M ~ [I,B] 


onde a matriz identidade 17 substituiu A na metade da esquerda de M. 


Passo 4 Defina A™ = B, a matriz que agora está na metade da direita de M. 


A justificativa para esse processo é a seguinte. Suponha que A seja invertível e que, digamos, a metade esquer- 
da de M, que é A, tenha sido reduzida à matriz identidade 7 com a sequência e,, e», ..., e, de operações elementares 
com as linhas de M = [A, 1]. Seja E, a matriz elementar correspondente à operação elementar e, Então, pelo Teo- 
rema 3.16, obtemos 


E... EEA=I o (E... EEJA=I, portanto, 4! =E,...E,E 


Isso mostra que AM pode ser obtida pela aplicação das operações elementares e,, e,, ..., e, à matriz identidade Z, que 
colocamos na metade da direita de M. Assim, B = A, como afirmamos. 


1 0 2 
Exemplo 3.20 Obtenha a inversa da matriz A = |2 —1 3 
4 1 8 
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Primeiro formamos a matriz (em blocos) M = [A, 1] e a reduzimos a uma forma escalonada. 


1 0 2,1 0 0 1 1 0 0 1 0 2, 1 0 0 
M=|2 -13,0 1 0|/-1]0 -1 -1,-2 1 0|-1]0 =I -1,-2 1 0 
4 1 810 0 1 0 I-4 0 1 0 0 —-1!-6 1 1 


Na forma escalonada, a metade da esquerda de M está em forma triangular, portanto, A tem inversa. Em seguida, 
continuamos reduzindo M à forma canônica por linhas. 


1 0 0 i —ll 2 2 1 0 0 — 2 2 
M-|0 -1 0, 4 0 -1|-|0 1 01 —4 0 1 
0 0 1! 6 = =] 0 0 1! 6 -1 + 


Agora, a matriz identidade está na metade da esquerda da matriz final, de modo que a metade da direita é A™. Em 
outras palavras, 


-11 2 2 
A =| -4 0 
6 -1 -1 


Operações elementares com as colunas 


Consideremos, agora, uma matriz A com colunas C, C,, ..., C,. As seguintes operações sobre A, análogas às opera- 
ções elementares com as linhas, são denominadas operações elementares com as colunas. 
[F,] (Troca da Ordem de Colunas) Trocar as colunas C, e C, entre si. 
[F,] (Multiplicação de Coluna por Escalar) Substituir a coluna C, por kC, (com k 0). 
[F;] (Soma de Colunas) Substituir a coluna C, por kC, + C, 
Podemos indicar cada uma dessas operações com as colunas escrevendo, respectivamente, 


(1) C&G e C; (2) kC; > C; (3) (kC: +C) > G 


Além disso, cada operação com as colunas tem uma operação inversa do mesmo tipo, exatamente como ocorre com 
as operações com as linhas. 

Sejam, agora, fuma operação elementar com as colunas e F a matriz obtida pela aplicação de f à matriz iden- 
tidade T, ou seja, 


F= KD 
Então F é denominada matriz elementar correspondente à operação elementar f. Observe que F sempre é uma ma- 


triz quadrada. 


Exemplo 3.21 Considere as operações elementares com as colunas a seguir. 
(1) Trocar C, e C, entre si. (2) Substituir C, por -2C.,. (3) Substituir C, por -3C, + C}. 


As matrizes elementares 3 x 3 correspondentes a essas operações elementares com as colunas são 


001 10 0 10 0 
Fn=|0 1 0|, F =ļ|0 1 of, m=|0 1 -3 
100 0 0 -2 00 1 


O teorema seguinte é análogo ao Teorema 3.16 relativo às operações elementares com as linhas. 


Teorema 3.20 Dada qualquer matriz A, temos f(A) = AF. 


Em outras palavras, o resultado de aplicar uma operação elementar f nas colunas de A pode ser obtido multipli- 
cando a matriz A pela matriz elementar correspondente F, nessa ordem. 
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Equivalência de matrizes 


Uma matriz B é equivalente a uma matriz A se B puder ser obtida a partir de A por uma sequência de operações com 
as linhas e as colunas. Equivalentemente, B é equivalente a A se existirem matrizes não singulares P e Q tais que B 
= PAQ. Da mesma forma que a equivalência por linhas, a equivalência de matrizes é uma relação de equivalência. 


O resultado principal desta subseção (demonstrado no Problema 3.38) é o seguinte. 
Teorema 3.21 Cada matriz m x n A é equivalente a uma única matriz em blocos da forma 
1 0 
0 0 
em que 1, é a matriz identidade de ordem r. 


Temos a definição seguinte. 


DEFINIÇÃO O inteiro não negativo r no Teorema 3.21 é o posto de A, denotado por pos(A). 


Observe que essa definição concorda com a definição já dada de posto de uma matriz. 


3.13 DECOMPOSIÇÃO LU 


Seja A uma matriz não singular que pode ser levada à forma triangular (superior) U usando somente operações de 
soma com as linhas, ou seja, A pode ser triangulada pelo algoritmo seguinte, que escrevemos na notação computa- 
cional. 


Algoritmo 3.6 Dada qualquer matriz A, este algoritmo produz uma matriz triangular U. 


Passo 1 Repitaparai=1,2,.,n—1 
Passo 2 Repita para j = i + 1, i + 2, ..., n 
(a) Tome m,; : = —a;/aj;- 
(b) Tome R; = mk; + R; 
[Fim do Passo 2, circuito interno. ] 
[Fim do Passo 1, circuito externo. ] 


Dizemos que os números m, são multiplicadores. As vezes, mantemos esses multiplicadores controlados pela 
matriz triangular inferior L seguinte. 


1 0 0 0 0 

-m, 1 0 0 0 

L= —M31 =M32 1 0 0 
Ma Ma Mp3 Man il 


Assim, L possui entradas 1 na diagonal, zeros acima da diagonal e o simétrico do multiplicador m, como sua 
ij-entrada abaixo da diagonal. 

Essa matriz L e a matriz triangular U obtida no Algoritmo 3.6 nos fornecem a clássica fatoração LU da matriz 
A. Temos o resultado seguinte. 


Teorema 3.22 Seja A uma matriz não singular que pode ser levada à forma triangular usando somente operações 
de soma com as linhas. Então A = LU, onde L é a matriz triangular inferior com entradas 1 na diagonal precedente 
e U é uma matriz triangular superior com zeros na diagonal. 
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1 2 =3 
Exemplo 3.22 Seja = | -3 —4 13 |. Observe que A pode ser reduzida à forma triangular com as 
2 | =5 
operações “Substituir R, por 3R, + R$”, “Substituir R, por -2R, + R$” e, por último, “Substituir R, por iR, + R3”, 
como segue. 
1 2 —3 12 -3 
ASI|IO 2 4/5102 4 
0 -3 1 00 7 
Isso dá a fatoração A = LU clássica, com 
1 00 1 2 -3 
L=|—3 1 0 e U=|0 2 4 
2 —ż 1 0 0 


Destacamos que 

(1) as entradas —3, 2 e — 5 de L são os simétricos dos multiplicadores das operações elementares com as linhas 
dadas e 

(2) Ué a forma triangular de A. 


Aplicações a sistemas de equações lineares 


Seja M um algoritmo computacional e denotemos por C(n) seu tempo de processamento como uma função do ta- 

manho n de seus dados iniciais. [A função C(n) costuma ser denominada complexidade temporal do algoritmo M 

ou, simplesmente, sua complexidade.] Frequentemente, C(n) simplesmente conta o número de produtos e quocien- 

tes executados por M, mas não conta o número de somas e subtrações, porque essas levam muito menos tempo. 
Seja, agora, AX = B um sistema quadrado de equações lineares, com 


A = [ai X = þa, X], B=[b,...,b 


e suponha que A tenha uma fatoração LU. Então o sistema pode ser levado a uma forma triangular pelo Algoritmo 
3.6 aplicado à matriz aumentada M = [A, B] do sistema (e depois efetuar a substituição para trás). A complexidade 
temporal do Algoritmo 3.6 e da substituição para trás são, respectivamente, 


onde n é a quantidade de equações. 

Por outro lado, suponha que já tenhamos a fatoração A = LU. Então, para triangular o sistema, basta aplicar as 
operações com as linhas do algoritmo (cuja memória está em L) ao vetor coluna B. Nesse caso, a complexidade 
temporal é 


C(n) 


Q 


É claro que, para obter a fatoração A = LU, precisamos do algoritmo original, em que C (n) = in’. Assim, possi- 
velmente nada é ganho calculando primeiro a fatoração LU no caso de um único sistema. Contudo, há situações, 
como a apresentada a seguir, em que a fatoração LU tem utilidade. 

Suponha que, para uma dada matriz A dada, necessitemos resolver o sistema 


AX =B 


repetidamente, para uma sequência de diferentes vetores constantes, digamos, B,, B,, ..., B,. Suponha, também, que al- 
guns desses vetores B, dependam da solução do sistema obtida usando vetores B, anteriores. Nesse caso, é mais eficaz 
obter, primeiro, a fatoração LU de A e, depois, utilizar essa fatoração para resolver o sistema para cada novo vetor B. 
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Exemplo 3.23 Considere o sistema de equações lineares seguinte. 


2x+ 3y+32z=k ou 4X =B, com A= 2 33 e B=|k, 
—3x + 10y + 2z = k, —=3 10 2 kz 


Digamos que queiramos resolver esse sistema três vezes, com B igual a, digamos, B,, B, e B,. Além disso, suponha 
que B; = [1, 1, 1]” e que 


Bn=B+X (para j= 1,2) 
onde X, é a solução de AX = B, Nesse caso, é mais eficaz obter, primeiro, a fatoração LU de A e, depois, utilizar 


essa fatoração para resolver o sistema para cada um dos vetores B. (Isso é feito nos Problemas 3.41 e 3.42.) 


Problemas Resolvidos 


Equações lineares, soluções, sistemas 2 X 2 


3.1 Decida se as equações dadas são lineares. 
(a) 5x + 7y — 8yz = 16, (b) x+7y+ez= logs, (c) 3x+ky— 82 = 16 
(a) Não, porque o produto yz de duas incógnitas é de grau 2. 
(b) Sim, porque 7 e log 5 são constantes. 


(c) Do jeito que está escrito, há quatro incógnitas, x, y, z, k e, por causa do termo ky, a equação não é linear. No entanto, 
considerando k constante, a equação é linear nas incógnitas x, y, z. 


3.2 Decida se os vetores dados são soluções de x, + 2x, — 4x, + 3x4 = 15: 
(a) u=(3,2,1,)e(b)v=(1,2,4,5). 
(a) Substituindo, obtemos 3 + 2(2) — 4(1) 4 
(b) Substituindo, obtemos 1 + 2(2) — 4(4) + 3(5) = 15, ou 4 = 15; não, não é uma solução. 


3(4) = 15, ou 15 = 15; sim, é uma solução. 


3.3 Resolva (a) ex=7, (b) 3x—-4-x=2x+3, (c) 7+2x-4=3x4+3-x 
(a) Como e £ 0, multiplicamos por 1/e para obter x = 7/e. 
(b) Reescrevendo a equação no formato padrão, obtemos Ox = 7. A equação não tem solução. 


(c) Reescrevendo a equação no formato padrão, obtemos Ox = 0. Qualquer escalar k é uma solução. 


3.4 Demonstre o Teorema 3.5. Considere a equação linear ax = b. 

G) Sea # 0, então x = b/a é a única solução de ax = b. 

(ii) Sea = 0, mas b 0, então ax = b não possui solução. 

Gii) Sea = 0 e b = 0, então cada escalar k é uma solução de ax = b. 
Suponha que a £ 0. Então existe o escalar b/a. Substituir b/a em ax = b fornece a(b/a) = b, ou b = b, portanto, b/a 
é uma solução. Por outro lado, digamos que x, seja uma solução de ax = b, ou seja, que ax, = b. Multiplicar ambos 
lados por 1/a fornece x, = b/a. Isso mostra que b/a é a única solução de ax = b e demonstra (i). Suponha, agora, que 
a = 0. Então, dado qualquer escalar k, temos ak = Ok = 0. Se b £ 0, então ak Æ b. e, por isso, k não é uma solução 


de ax = b, demonstrando (ii). Se b = 0, então ak = b, ou seja, qualquer escalar k é uma solução de ax = b, demons- 
trando (iii). 
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3.5 Resolva cada um dos sistemas seguintes. 


2x — 5y = 11 2x — 3y = 8 2x—-3y= 8 
@ quedy=s O æ+- 6 O 4x46 = -16 


(a) Eliminamos x das equações formando a nova equação L = —3L, + 2L,. Isso fornece a equação 
23y = -23 e, então, y=-l 
Substituímos y = —1 em uma das equações originais, digamos, L,, para obter 
2x — 5(-1)= 11 ou 2x+5=11 ou 2x=6 ou x=3 
Assim, x = 3, y = —1 ou o par u = (3,-1) é a única solução do sistema. 
(b) Eliminamos x das equações formando a nova equação L = 3L, + L,. Isso fornece a equação 
Ox + 0y = 30 


Isso é uma equação degenerada com termo constante não nulo, portanto, essa equação e o sistema não têm solução. 
(Geometricamente, as retas correspondentes às equações são paralelas distintas.) 


(c) Eliminamos x das equações formando a nova equação L = 2L, + L,. Isso fornece a equação 
Ox + Oy = O 


Isso é uma equação degenerada com termo constante nulo, portanto, o sistema tem uma infinidade de soluções, 
que correspondem às soluções de qualquer uma das duas equações. (Geometricamente, as retas correspondentes 
às equações coincidem.) 

Para encontrar a solução geral, tomamos y = a e substituímos em L, para obter 


2x — 3a = 8 ou 2x = 3a + 8 ou x=2a+4 
Assim, a solução geral é 
x=2a+4, y=a ou u= (Ga-+4, a) 


com a um escalar qualquer. 


3.6 Considere o sistema 
x+ay=4 
ax+9y =b 
(a) Para quais valores de a o sistema tem solução única? 


(b) Encontre os pares (a, b) de valores para os quais o sistema tem mais do que uma solução. 


(a) Eliminamos x das equações formando a nova equação L = —aL, + L,. Isso fornece a equação 


(9 — @)y =b — 4a (1) 


O sistema tem solução única se, e só se, o coeficiente de y em (1) for não nulo, ou seja, se 9 — a? £ 0 ousea £ +3. 


(b) O sistema tem mais do que uma solução se ambos lados de (1) forem nulos. O lado esquerdo é nulo se a = +3. 
Quando a = 3, o lado direito é nulo se b — 12 = 0, ou b = 12. Quando a = -3, o lado direito é nulo se b + 12 = 
0, ou b = —12. Assim, (3, 12) e (-3, -12) são os pares para os quais o sistema tem mais do que uma solução. 


Sistemas em forma triangular e escalonada 


3.7 Encontre as variáveis pivôs e livres de cada um dos sistemas seguintes. 


2x, = 3x) — 6x3 — 5x4 +2x5 =7 2x—-6y+7z2=1 x+2y—-32=2 
x, + 3x4 — 7x; — 6 4+32=8 2x+3y+ z=4 
x, —2x5=1 2z=4 3x + 4y +5z=8 


(a) (b) (c) 


(a) Em forma escalonada, as incógnitas líderes são as variáveis pivôs e as outras são as variáveis livres. 
Aqui, x,, x, € x, São as variáveis pivôs e x, e x, são as variáveis livres. 


3.8 


3.9 


3.10 
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(b) As incógnitas líderes são x, y e z, portanto, são as variáveis pivôs. Não há variáveis livres (como em todo sistema 
triangular). 


(c) O conceito de variável pivô e livre só se aplica a sistemas em forma escalonada. 


Resolva o sistema triangular do Problema 3.7(b). 
Por ser um sistema triangular, resolvemos por substituição para trás. 
(1) A última equação dá z = 2. 


(11) Substituímos z = 2 na segunda equação e obtemos 4x + 6 = 8, ou y = L 


(iii) Substituímos z = 2 e y = ina primeira equação e obtemos 
1 
2x —6|5 +7(2)=1 ou 2x+1l=1 ou x=—5 


Assim, x 5, y lz 2 ouu = (—5, 


À , 2) é a única solução do sistema. 


Resolva o sistema escalonado do Problema 3.7(a). 


Atribuímos parâmetros às variáveis livres, digamos, x, = a e x, = b e resolvemos nas variáveis pivôs por substituição 
para trás. 
G) Substituímos x, = b na última equação e obtemos x, — 2b = 1, ou x, = 2b + 1. 


Gi) Substituímos x, = b e x, = 2b + 1 na segunda equação e obtemos 


x +3(2b+1) —-7b=6 ou x—-b+3=6 ou xw-b+3 


iii) Substituímos x, = b,x,=2b+ 1,x,=b+3ex, = a na primeira equação e obtemos 
5 4 3 2 p quaç 


2x; — 3a — 6(b + 3) -5(2b+1)+2hb=7 ou 2x; — 3a -— 14b -23 =7 


ou x =5a+7b+15 


Assim, 


3 
xı =74+7b +15, Xx =a, x =b +3, x = 2b + L; x; =b 


ou u= (gasosas, a, b+3, 2b+1, b) 


é a forma paramétrica da solução geral. 
Alternativamente, resolvendo nas variáveis pivôs x,, x,, x, em termos das variáveis livres x, e x,, obtemos a forma 
de variáveis livres da solução geral seguinte. 


3 
xı = 5%2 + 7x5 + 15, x3 = X5 + 3, x4 = 2x5 +1 


Demonstre o Teorema 3.6. Considere o sistema (3.5) de equações lineares em forma escalonada de r equa- 
ções com n incógnitas. 


(1) Ser = n, então o sistema tem uma única solução. 


Gi) Ser < n, então podemos atribuir arbitrariamente valores às n — r variáveis livres e resolver de modo único nas r 
variáveis pivô, obtendo uma solução do sistema. 


G) Suponha que r = n. Então temos um sistema quadrado AX = B em que a matriz de coeficientes é triangular 
(superior) com elementos diagonais não nulos. Assim, A é invertível. Pelo Teorema 3.10, o sistema tem uma 
solução única. 


Gi) Atribuindo valores às n — r variáveis livres, obtemos um sistema triangular nas variáveis pivôs, que, por (i), tem 
uma solução única. 
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Eliminação gaussiana 


3.11 Resolva cada um dos sistemas seguintes. 


(a) 


(b) 


(c) 


x+2y—4z= —4 x+2y— 32 = -=l x+2y— 32=1 
2x+5y— 92 = —10 —3x+ y—-22=—7 2x+5y— 82=4 
3x—-2y+32= 1 5x+3y—-42= 2 3x + 8y — 13z = 7 


(a) (b) (c) 


Reduza cada sistema à forma triangular usando eliminação gaussiana. 

Aplicamos “Substituir L, por —-2L, + L,” e “Substituir L, por -3L, + L,” para eliminar x da segunda e terceira 
equações e, depois, aplicamos “Substituir L, por 8L, + L,” para eliminar y da terceira equação. Essas operações 
fornecem 


x+2y— 4z= —4 x+ 2y — 4z = —4 
y— z=-2 e, então y— z=—2 
-8y + 15z= 23 Iz= 7 


O sistema está em forma triangular. Com substituição para trás, obtemos a solução única u = (2, —1, 1). 
Eliminando x da segunda e terceira equações pelas operações “Substituir L, por 3L, + L,” e “Substituir L, por 
—SL, + L,”, obtemos o sistema equivalente 


x+2y— 3z= -l1 
7y— 1iz= -10 
—7y+1lz= 7 


A operação “Substituir L, por L, + L,” fornece a equação degenerada de termo constante não nulo 
Ox + Oy + Oz = -3 


Essa equação e, portanto, o sistema, não têm solução. 
Eliminando x da segunda e terceira equações pelas operações “Substituir L, por -2L, + L,” e “Substituir L, por 
-3L, + L;”, obtemos o sistema equivalente 


As x+2-32=1 
y—-22=2 Ed 
2)-42=4 Rs 


(Omitimos a terceira equação por ser um múltiplo da segunda equação.) O sistema está em forma escalonada com 
variáveis pivôs x e y e variável livre z. 

Para encontrar a forma paramétrica da solução geral, tomamos z = a e resolvemos em x e y por substituição para 
trás. Substituindo z = a na segunda equação, obtemos y = 2 + 2a. Substituindo z = a e y = 2 + 2a na primeira 
equação, obtemos 


x+20 +24) -3a=1 ou x+4+a=1 ou =-3-a 


Assim, a solução geral é 


x=-3-ay=2+2a,z=a ou u=(3-a,2+2a,a), 


onde a é um parâmetro. 


3.12 Resolva cada um dos sistemas seguintes. 


x, — 3x, +2x,)— x +2x5=2 X 2x) — 3x3 tAr = 2 
3x1 9x, 1x3 X4 3x5 =7 2x| 5x2 2x3 X4 = 1 
2x4 mmr 6x, E 7x3 + 4x4 g 5x5 = 7 5x1 12x, 1x3 6x4 = 3 


(a) (b) 


Reduza cada sistema à forma escalonada usando eliminação gaussiana. 


(a) 


(b) 
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Aplicamos “Substituir L, por -3L, + L,” e “Substituir L, por -2L, + L,” para eliminar x da segunda e terceira 
equações. Isso fornece 


Xi — 3x, + 2x3 = X4 + 2x5 =2 
x3 + 2x4 — 3x; = 1 ou 
3x3 + 6x4 — 9x; = 3 


xı — 3x + 2x3 — x4 +2x; = 2 
xX, + 2x4 — 3x; = 1 


(Omitimos L, por ser um múltiplo de L,.) O sistema está em forma escalonada com variáveis pivôs x, e x, e variá- 
veis livres x,, X4, X3. 

Para encontrar a forma paramétrica da solução geral, tomamos x, = a, x, = b, x, = c, em que a, b e c são parâme- 
tros. Com substituição para trás, obtemos x, = 1 — 2b + 3c e x, = 3a + 5b — 8c. A solução geral é 


n= 3a t Sbm 8a maa = lm pt 3e = bame 


ou, equivalentemente, u = (3a + 5b — 8c, a, 1 — 2b + 3c, b, c). 


Eliminando x, da segunda e terceira equações pelas operações “Substituir L, por -2L, + L,” e “Substituir L, por 
—5L, + L;”, obtemos o sistema equivalente 


x +2x — 3x; + 44 = 2 
X, + 4x; — 1x4 = —3 
2x, + 8x3 = 14x4 = —7 


A operação “Substituir L, por -2L, + L,” fornece a equação degenerada O = —1. Assim, o sistema, não tem solução 
(embora tenha mais incógnitas do que equações). 


3.13 Resolva usando o formato condensado. 


2y+32= 3 
x+ y+ z= 4 
4x + 8y — 3z = 35 


O formato condensado é o seguinte. 


Número Equação Operação 

(2) (1) 2y+ 32= 3 Lel 

(1) (2) x+ y+ z= 4 L eL 
(3) 4x+8y— 3z=35 


) 4y— 7z=19 Substituir L, por— 4L, + L; 
o — 13z= 13 Substituir L, por— 2L, + L; 


Aqui, (1), (2) e (37) formam um sistema triangular. (Enfatizamos que a troca de L, com L, foi efetuada simplesmente 
trocando os números das equações.) 


Usar substituição para trás no sistema triangular fornece z = —1 em L,, y = 3 em L, ex = 2 em L. Assim, a única 
solução do sistema é x = 2, y = 3, z = —1, ou o terno u = (2,3,-1). 


3.14 Considere o sistema 


(a) 
(b) 


x+2y+ z= 3 
ay + 5z = 10 
2x+7y+az= b 


Encontre os valores de a que fazem com que o sistema tenha solução única. 
Encontre os pares de valores (a, b) que fazem com que o sistema tenha mais do que uma solução. 


Reduzimos o sistema à forma escalonada, ou seja, eliminamos x da terceira equação pela operação “Substituir L, 


por -2L, + L,” e depois eliminamos y da terceira equação pela operação 
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“Substituir L, por -3L, + aL;”, obtendo 


x+2y + 2=3 x+2y+ z=3 
ay +5z= 10 e, então, ay + 52 = 10 
3y+(a-2)2=b-6 (a? — 2a — 15)z = ab — 6a — 30 


Examinemos a última equação (a? — 2a — 15)z = ab — 6a — 30. 
(a) O sistema tem solução única se, e só se, o coeficiente de z não é zero, ou seja, se 


a -Za-lS=(a-5a+)£O0 ou a#5 e af-3. 


(b) O sistema tem mais do que uma solução se ambos lados são nulos. O lado esquerdo é nulo se a = 5 ou a = —3. Se 
a = 5, o lado direito é zero se 5b — 60 = 0, ou b = 12. Se a = -3, o lado direito é zero se-3b — 12 = 0, ou b = 
—4. Assim, (5, 12) e (-3, —4) são os pares com os quais o sistema tem mais do que uma solução. 


Matrizes escalonadas, equivalência por linhas, forma canônica por linhas 


3.15 Reduza à forma escalonada as matrizes 


12 -3 0 —4 1 —6 
(a) 4=|2 4 -2 2], (b) B= 1 2 =5 
3 6 —4 3 6 3 —4 
(a) Usamos a, = 1 como um pivô para obter zeros abaixo de a,,, ou seja, usamos as operações com as linhas 


“Substituir R, por -2R, + R,” e “Substituir R, por -3R, + R,”. Depois usamos a,, = 4 como um pivô para obter 
zeros abaixo de a,,, ou seja, usamos a operação com as linhas “Substituir R, por -3R, + R,”. Essas operações 
fornecem 


Agora a matriz está em forma escalonada. 

(b) Os cálculos manuais costumam ser mais simples se o elemento pivô for igual a 1. Por isso, trocamos R, com R,. Em 
seguida, aplicamos as operações “Substituir R, por 4R, + R,” e “Substituir R, por -6R, + R,” e, depois, “Substituir 
R, por R, + R$”. Essas operações fornecem 


1 2 =5 1 2 -5 1-2 =5 
B-|-4 1 -6|-|0 9 —26|~ |0 9 —26 
6 3 —4 0 —9 26 0 0 0 


Agora a matriz está em forma escalonada. 


3.16 Descreva o algoritmo de redução por pivotamento. Também descreva as vantagens, se houver, da utilização 
desse algoritmo. 


O algoritmo de redução se torna um algoritmo de pivotamento se escolhermos como pivô q; a entrada na coluna j 
de maior valor absoluto e se usarmos a operação com a linha 


(—a; /ay)Ri +R; > R; 


A principal vantagem do algoritmo por pivotamento é que essa operação com as linhas envolve a divisão pelo pivô atual 
a; e, no computador, os erros de arredondamento podem ser substancialmente reduzidos se dividirmos por um número 
com o maior valor absoluto possível. 


2 —2 2 1 
3.17 Seja 4 = | —3 6 0 —1 |. Reduza A à forma escalonada usando o algoritmo por pivotamento. 
1 —-7 10 2 
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Inicialmente trocamos R, com R, para que possamos usar —3 como o pivô e, então, aplicamos as operações “Substituir 


R, por E R; + R$” e “Substituir R, por Ri + R$”. Essas operações fornecem 


-3 6 0 -1 -3 6 0 -I 
de) 2-2 2 Te) 0 22 1 
1 -7 10 2 0 -5 10 å 


Agora trocamos R, com R, para que possamos usar —5 como o pivô e, então, aplicamos as operações “Substituir R, por 
E) >> 
4R + R3”. Obtemos 


=3 6 0 
Am 0 —5 10 
0 2 2 


ww = 


Reduzimos a matriz à forma escalonada utilizando pivotamento. 


3.18 Reduza cada uma das matrizes seguintes à forma canônica por linhas. 


2 2 -l 6 4 5 -9 6 
(a) 4=|4 4 1 10 B|, ®© B=|0 23 
8 8 -1 26 23 0 07 


(a) Inicialmente reduzimos A à forma escalonada aplicando as operações “Substituir R, por -2R, + R,” e “Substituir 
R, por -4R, + R,” e, depois, “Substituir R, por -R, + R$”. Essas operações fornecem 


"e 6 4 2-2 =l 6 4 
A-|O 0 3 =2 5|- 10 0 3 2.5 
0 0 3 2 7 00 0 4 2 


Agora substituímos para trás na matriz escalonada para obter a forma canônica por linhas de A. Mais precisamen- 


te, primeiro multiplicamos R, por i para obter o pivô a,, = 1 e, então, aplicamos as operações “Substituir R, por 
2R, + R,” e “Substituir R, por -6R, + Rj”. Essas operações fornecem 


22 -1 64 2 2 
An|0 0 3 -2 5|~jo 0 
00 0 11 00 


22101 22 0 0 3 
A~ jO 0 1 0 2|~]O O 1 0 2 
00 011 00011 
Finalmente, multiplicamos R, por 1, obtendo o pivô a,, = 1. Assim, obtemos a forma canônica por linhas seguinte 


de 4. 


11 00 
A-|0 0 1 0 
0 0 0 1 


N= NNi 


(b) Como B está em forma escalonada, substituímos para trás para obter 


5 —9 6 5 —9 0 5 =9º O 5 0 0 1 0 0 
B-I0O 23|-10 2 0/-10 1 0/-|10 1 0/-10 1 0 
0 0 0 0 1 0 0 1 


A última matriz, que é a matriz identidade 1, é a forma canônica por linhas de B. (Isso era de se esperar, porque B é 
invertível e sua forma canônica por linhas deve ser Z.) 


3.19 Descreva o algoritmo de eliminação de Gauss-Jordan, que também reduz uma matriz A arbitrária a sua for- 
ma canônica por linhas. 
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De certa forma, o algoritmo de Gauss-Jordan é análogo ao algoritmo de eliminação gaussiana, exceto que, nele, 
cada pivô é utilizado para colocar zeros tanto acima quanto abaixo do pivô, e não só abaixo, antes de passar para o 
próximo pivô. Além disso, numa variação desse algoritmo começamos normalizando cada linha, ou seja, obtemos 


um pivô unitário, antes de utilizá-lo para produzir os zeros nas outras linhas, em vez de normalizar no final do 
algoritmo. 


=2 3 1 2 
3.20 Seja 4 = |1 1 4 -1 3 


. Use Gauss-Jordan para encontrar a forma canônica por linhas de A. 
2 5 9 -2 $ 


Usamos a,, = 1 como um pivô para obter zeros abaixo de a,, aplicando as operações “Substituir R, por -R, + R,” 
e “Substituir R, por -2R, + R$”. Isso fornece 


-23 1 
A-|0O 3 1 —2 1 

0 93 4/4 
Multiplicamos R, por 4, obtendo o pivô a, = 1 e, então, obtemos zeros abaixo e acima de a,, aplicando as operações 
“Substituir R, por -9R, + R,” e “Substituir R, por 2R, + R,”. Essas operações fornecem 


i23 dd iou -ig 
AN|0O 1 $ -34 ij~jo 1 4 —2 1 
O 9 3 4 4 0 0 0 2 1 


Finalmente, multiplicamos R, por 5 para obter o pivô a}, = 1 e, então, obtemos zeros abaixo e acima de a,, aplicando as 
operações “Substituir R, por 2 R, + R$” e “Substituir R, por 1 R, + R’. Essas operações fornecem 


Log SM P0503 
Anjo 1 1 -21]n|01 102 
000 11 00011 


que é a forma canônica por linhas de 4. 


Sistemas de equações lineares em forma matricial 


3.21 Encontre a matriz aumentada M e a matriz de coeficientes A do sistema seguinte. 


x+2y—-32=4 
3y—- 42 47x =5 
6z+8x-—-9y=1 


Inicialmente, alinhamos as incógnitas do sistema e, depois, usamos o sistema alinhado para obter M e A. Temos 


x+2y—-32=4 1 2 =3 4 I 2 =3 
Tx +3y—4z=5; então M=|7 3 —4 5 e A=|7 3 —4 
8 


8x- 9y +6z=1 8 -9 61 


3.22 Resolva cada um dos sistemas seguintes utilizando sua matriz aumentada M. 


x+2y— z= 3 x—2y+42=2 x+ y+32=1 
x+3y+ z= 5 2x —-3y+52=3 2x+3y— z=3 
3x + 8y+42=17 3x — 4y + 6z=7 Sx+7y+ z=7 


(a) (b) (c) 


(a) Reduzimos a matriz aumentada M à forma escalonada como segue. 


l o2 =L 3 l 2 1.3 12 =l 
M=|13 1 5|- 10 1 2 2/-|0 1 2 
3 8 4 17 02 78 0 0 3 


(b) 


(c) 
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Agora escrevemos o sistema triangular correspondente 


x+2y-z2=3 
y+22=2 
32=4 


e substituímos para trás para obter a solução única 


— 17 = 2 — 4 — (17 2 4 
X=5,)=-5,2=3 ou u=(5,-5,5) 


Alternativamente, reduzimos a forma escalonada de M à forma canônica por linhas, obtendo 


1 2 -1 3 120 100 #4 
M~jO 1 22|=-]0 1 0 -&|=|0 1 0 -4 
4 
00 13 0 0 1 é 0 0 1 é 
Isso também corresponde à solução encontrada antes. 
Inicialmente reduzimos a matriz aumentada M à forma escalonada como segue. 
1-2 4 2 1 -2 4 2 1 -2 4 2 
M=]|2 -3 5 3|~]|0 1 -3 1]-/0 1 -3 -1 
3 —4 6 7 0 2 6 l 0 0 0 3 


A terceira linha corresponde à equação degenerada 0x + 0y + Oz = 3, que não tem solução. Assim, “NÃO CON- 
TINUE”. O sistema original também não tem solução. (Observe que a forma escalonada indica se o sistema tem 
ou não tem solução.) 


Reduzimos a matriz aumentada M à forma escalonada e, depois, à forma canônica por linhas, como segue. 


11 3 1 1 1 3 1 
M=]|2 3 13]-10 1 -7 1 e i 
02 


57 17 


(Omitimos a terceira linha da segunda matriz por ser um múltiplo da segunda linha e acarretar uma linha de zeros.) 
Escrevemos o sistema correspondente à forma canônica por linhas de M e depois transferimos as variáveis livres 
para o outro lado para obter a forma de variáveis livres da solução 


x+102=0 E x=—10z 
Po TA] y=1+7z 


Aqui, z é a única variável livre. A solução paramétrica, usando z = a, é dada a seguir. 


x 10a, y=1+7a, z=a ou u = (—10a, 1+7a, a) 


3.23 Resolva o sistema seguinte utilizando sua matriz aumentada M. 


2x4 =e 5x7 y 8x3 ia X4 + 6x5 = 4 
x + 4x — 7x3 + 5x4 + 2x; = 8 


Reduzimos a matriz aumentada M à forma escalonada e, depois, à forma canônica por linhas. 


M= 


12 =3 241 12 =3 -2 4 1 1 2 -3 -2 4 
2 5 -8 -l1 6 4|~]O 1 -2 3 =2 2| |0 1I =2 3. =2 2 
1 4 -7 528 02 -4 7 -2 7 00 0 1 2 3 
l 2.3 8 7 1 0 1 0 24 21 

0 1 -2 0 -8 -7T|-|0 1 -2 0 -8 -7 

0 0 0 I 2 3 0 0 01 2 2 


Escrevemos o sistema correspondente à forma canônica por linhas de M e depois transferimos as variáveis livres para o 
outro lado para obter a forma de variáveis livres da solução 


x + x3 + 24x; = 21 xı = 21 — x; — 24x; 
x, — 2x3 — 8x5 = —7 e x = —7 + 2x3 + 8x5 
x4 +t2x;= 3 x4 = 3 — 2x5 
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Aqui, x, x, € x, São as variáveis pivôs e x, e x, são as variáveis livres. Lembre que a forma paramétrica da solução pode 
ser obtida a partir da forma de variáveis livres da solução simplesmente igualando as variáveis livres a parâmetros, 
digamos, x, = a e x, = b. Assim, obtemos 


x=21-a-24b,x,=-1+2a+8b,x=0,14=3-2b,x,=b 
ou u = (21 — a — 24b, -7 + 2a + 8b,a,3 — 2b, b) 


que é outra forma da solução. 


Combinações lineares, sistemas homogêneos 


3.24 Escreva v como combinação linear dos vetores u,, u, € u, dados a seguir. 
(a) v = (3, 10, 7) e u; = (1,3, —2), u = (1,4,2), u3 = (2,8,1); 
(b) v = (2,7, 10) e u = (1,2,3), u = (1,3,5), us = (1,5,9); 
(0) v= (1,5, 4) e u = (1,3, —2), u = (2,7, —1), u; = (1,6,7). 


Formamos o sistema de equações lineares equivalente escrevendo v = xu, + yu, + zu, ou, então, usamos a matriz au- 
mentada M do sistema equivalente, em que M = [u,, U, uz, V]. (Aqui, u,, U, U, € v são as colunas de M.) 
(a) A equação vetorial v = xu, + yu, + zu, com os vetores dados é dada por 


3 1 1 2 x+y+2z 
10| =x] 3| +y|4| +z]8| = | 3x+4y+ 8z 
7 =2 2 1 x + 2y +z 


Igualando as entradas correspondentes, formamos o sistema de equações lineares equivalente que reduzimos à 
forma escalonada, como segue. 


x+ y+2z= 3 x+ y+2= 3 x+y+22=3 
3x+4y + 82 = 10 ou y+2z= 1 ou y+22=1 
=x +2y-+ 2= 7 4y + 5z = 13 =37 = 9 


O sistema está em forma triangular. Substituindo para trás, obtemos x = 2, y = 7, z = —3. Assim, v = 2u, + 7u, — 3u. 
Alternativamente, formamos a matriz aumentada M = [1,, u,, u}, V] do sistema equivalente e reduzimos M à forma 
escalonada, como segue. 


| las 3 1123 11 2 3 
M = 3 4 8 10/-]/0 1 2 1/-1]0 1 2 1 
-2 2 1 7 0 4 5 13 0 0 —3 9 


A última matriz corresponde a um sistema triangular que tem uma solução única. Substituindo para trás, obtemos 
a solução x = 2, y = 7, z = —3. Assim, v = 2u, + 7u, — 3u. 


(b) Formamos a matriz aumentada M = [u,, u,, u,, V] do sistema equivalente e reduzimos M à forma escalonada, como 


segue. 
11 1 2 1112 1 1 1 2 
M=]|2 3 5 T-|10133/-1013/3 
3 5 9 10 02 6 4 0 0 0 -2 
A terceira linha corresponde à equação degenerada Ox + Oy + Oz = —2, que não tem solução. Assim, o sistema 


também não tem solução, e v não pode ser escrito como uma combinação linear de u,, u,, u}. 


(c) Formamos a matriz aumentada M = [w,, u,, Uz, U] do sistema equivalente e reduzimos M à forma escalonada, como 
segue. 


= =] |) 
a om 
Auns 
? 
Som 
Ww e N 
OU m 
NV mm 
? 
Dom 
O= N 
OU m 
SN m 


3.25 


3.26 


3.27 
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A última matriz corresponde a um sistema com uma variável livre z. 


x+2y+4 z=1 
y+32=2 


Assim, v pode ser escrito de várias maneiras como uma combinação linear de u,, u, u}. Por exemplo, tomando a 
variável livre como z = 1 e substituindo para trás, obtemos y = —2 e x = 2. Assim, v = 2u, — 2u, + us. 


Sejam u; = (1, 2, 4), u, = (2,-3, 1), u, = (2, 1, —1) vetores de R°. Mostre que u,, W, U} São ortogonais e 
escreva v como uma combinação linear de u, u,, u, se (a) v = (7, 16,6), (b) v = (3, 5, 2). 
Tomamos o produto escalar dos pares de vetores e obtemos 

uu=2-6+4=0, uu=2+2-4=0, uu=4-3-1=0 


. á Ss . sè . . 
Assim, os três vetores de R` são ortogonais e, portanto, podemos usar coeficientes de Fourier, ou seja, v = xu, + yu, 
+ zu, com 


v: ui U: Uz U: u3 
x= ——, => = 
uy ` Ui uz ` Uz u3 ` U3 
(a) Temos 
7+32+24 63 3 14—48 +6 -28 2 14+16-6 24 7 
= = = = = = = = = 
1444+16 2” Y= 4941 Má i 4+1+1 6 
Assim, v = 3u, — 2u, + 4u,. 
(b) Temos 
3+10+8 21 1 6-15+2 -7 jl 6+5-2 9 3 
= = = = = = ——, = =-= 
1+4+16 21 ? 4+9+1 14 2’ 4+1+1 6 2 


2x1 4x, 5x3 3x4 = 0 X — 2y —32=0 
3x4 6x, — Tx, +4x, = 0 2x+ y+32=0 
5x, + 10x, — 11x, + 6x4 = 0 3x — 4y — 2z = 0 


(a) (b) 
(a) Reduzimos o sistema à forma escalonada usando as operações “Substituir L, por -3L, + 2L,”, “Substituir L, por 
—5L, + 2L,” e, depois, “Substituir L, por —2L, + L;”. Essas operações fornecem 


2x, + 4x, — 5x3 + 3x4 = 0 


PORE 2x, + 4x — 5x3 + 3x4 = 0 


x; — x,=0 


3x3 — 3x4 = 0 
O sistema escalonado tem as duas variáveis livres x, e x,, portanto dim W = 2. Uma base de W pode ser obtida 
como segue. 
(1) Tomando x, = 1, x, = O, substituímos para trás para obter x, = 0 e, então, x, = —2. Assim, u, = (-2, 1, 0, 0). 


(2) Tomando x, = 0, x, = 1, substituímos para trás para obter x, = 1 e, então, x, = 1. Assim, u, = (1, 0, 1, 1). 


(b) Reduzindo o sistema à forma escalonada, obtemos 


x—2y-32=0 x—-2y-32=0 
5y+9z2 = 0 e 5y+9z2=0 
2y+7z=0 17z=0 


Não há variáveis livres (o sistema está em forma triangular). Logo, dim W = 0 e W não possui base. Mais precisa- 
mente, W consiste somente na solução nula, ou seja, W = (0). 


Utilizando notação matricial, encontre a dimensão e uma base do conjunto solução W do sistema homogê- 
neo seguinte. 


Xi 2x, 3x3 2x4 4xs = 0 
2x1 4x, 8x3 X4 9xs =] 0 
3x, + 6x, + 13x, + 4x4 + 14x; = 0 
Mostre como a base dá a forma paramétrica da solução geral do sistema. 


Um sistema homogêneo é representado por sua matriz de coeficientes A em vez da matriz aumentada M, porque a últi- 
ma coluna da matriz aumentada M é nula e permanece nula ao longo de qualquer algoritmo de redução. 


n]  Árcesra Linear 


Reduzimos a matriz de coeficientes A à forma escalonada, obtendo 


12 3-2 4 12324 
4=|24 8 1 9|-|0 02 ER ae 
3 6 13 4 14 004 102 


(A terceira linha da segunda matriz foi suprimida, por ser um múltiplo da segunda linha e resultar numa linha nula.) 
Agora podemos continuar de duas maneiras. 


(a) 


(b) 


Escrevemos o sistema homogêneo correspondente em forma escalonada. 


x, +2x, + 3x3 — 2x4 + 4x5 = 0 
2x3 + 5x4 + x5 =0 


O sistema escalonado tem as três variáveis livres x,, x, € xs, portanto dim W = 3. Uma base [u,, u,, u,] de W pode 
ser obtida como segue. 


(1) Tomando x, = 1, x, = 0, x, = 0, substituímos para trás para obter x, = 0 e, então, x, = —2. Assim, 
u, = (-2,1,0,0,0). 


(2) Tomando x, = 0, x, = 1, x, = 0, substituímos para trás para obter xy = — 5, e, então, x, = D Assim, 


uy = (2,0,-3, 1,0). 
(3) Tomando x, = 0, x, = 0, x, = 1, substituímos para trás para obter x; = — > e, então, x, = — 5, Assim, 
Z 5 1 
uz = (=>; 0, —250, 1). 


[Poderíamos evitar frações na base escolhendo x, = 2 em (2) e x, = 2 em (3), que produzem múltiplos de u, e 
u,.] Obtemos a forma paramétrica da solução geral como uma combinação linear dos vetores da base utilizando 
parâmetros x, y e z. 


19 
2 


Xu, + yu, + Zuz = (—2x 4 
Reduzimos a forma escalonada de A à forma canônica, como segue. 


1 2 3 -2 4 12 0 -2 
Ae 0 0 1 5 1 ~ 5 
3 0 0 1 5 


Nie Niv 
i 


Agora escrevemos a correspondente solução de variáveis livres 


xı = —2x, + Ea — = 
2 2 
5 1 
X3 = T7% = 2*5 


Usando essas equações para as variáveis pivôs x, e x,, repetimos o processo da opção (a) para obter uma base 
[u,, u, Us] de W. Ou seja, tomamos x, = 1, x, = 0, xs = O para obter u,; tomamos x, = 0, x, = 1, x, = O para 
obter u, e tomamos x, = 0, x, = 0, x, = 1 para obter u,. 


3.28 Demonstre o Teorema 3.15. Sejam v, uma solução particular de AX = Be W o conjunto solução de AX = 0. 
Então U = vo + W = {vo +w : w € W }é o conjunto solução de AX = B. 


Seja w uma solução de AX = 0. Então 


Alv +w) =Awy+tAw=B+0=B 


Assim, a soma v, + w é uma solução de AX = B. Por outro lado, seja v uma solução de AX = B. Então 


A(v— w) =Av—- Av =B-B=0 


Portanto, v — v, pertence a W. Como v = v + (v — v), vemos que toda solução de AX= B pode ser dada pela soma de 
uma solução de AX = 0 com uma solução de AX = B. O teorema está demonstrado. 
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Matrizes elementares, aplicações 


3.29 Sejam e,, e, e; respectivamente, as operações elementares com as linhas 
“Trocar as linhas R, e R, entre si”, “Substituir R, por 7R;” e “Substituir R, por -3R, + R,” 

Encontre as matrizes elementares E,, E,, E, de ordem 3 correspondentes. 

Aplicando cada operação à matriz identidade T, de ordem 3, obtemos 


0 1 0 1 0 0 1 
É, = 1 0 0 , E, = 0 1 0 , E3 -= —3 
001 0 0 7 0 


3.30 Considere as operações elementares com as linhas dadas no Problema 3.29. 
(a) Descreva as operações inversas e; !, é !, e; 1. 
(b) Encontre as matrizes elementares E), E}, Æ} de ordem 3 correspondentes. 
(c) Qual é a relação entre as matrizes Ei; E E; e as matrizes E, E,, E3? 
(a) As inversas de e,, e,, e, são, respectivamente, 
“Trocar as linhas R, e R, entre si”, “Substituir R, por 2 R3” e “Substituir R, por 3R, + R$” 
(b) Aplicando cada operação inversa à matriz identidade 1, de ordem 3, obtemos 
0 0 1 0 0 
0f, E;=|3 1 0 
0 0 1 


010 1 
Ej=[|1 0 0l, E =|0 
001 001 


1 
0 
(c) As matrizes E’, Ez E; são, respectivamente, as inversas das matrizes E,, E,, E3. 


3.31 Escreva cada uma das matrizes seguintes como um produto de matrizes elementares. 


TE 12 3 | 12 
@ 4=|5 | b) B=|0 1 4l, © C=|2 38 
001 = = 2 


Para escrever uma matriz M como um produto de matrizes elementares utilizamos os três passos seguintes. 
Passo 1 Reduzimos M à matriz identidade 7, fazendo um registro das operações utilizadas. 


Passo 2  Escrevemos as operações inversas das registradas. 


Passo 3  Escrevemos M como o produto das matrizes elementares correspondentes às operações inversas, que é o 
resultado procurado. 


Se aparecer uma linha nula no Passo 1, então M não é equivalente por linhas à matriz identidade e M não pode ser escrita 
como um produto de matrizes elementares. 


(a) (1) Temos 
| = 1 -3 1 -3 10 
dalh w Go | lo Ja 


em que as operações com as linhas são, respectivamente, 
“Substituir R, por 2R, + R$”, “Substituir R, por — ł Rz’, “Substituir R, por 3R, + R,” 
(2) As operações inversas são 


“Substituir R, por -2R, + R$”, “Substituir R, por -2R,”, “Substituir R, por -3R, + R,” 


4=| IE Er E 
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(b) (1) Temos 
1 2 3 1 2 0 1 0 0 
B=|I0 1 4|-10 1 OJ~ 10 1 0| =I 
0 0 1 0 0 1 0 0 1 
em que as operações com as linhas são, respectivamente, 


“Substituir R, por 4R, + R,”, “Substituir R, por -3R, + R,”, “Substituir R, por -2R, + R,” 


(2) As operações inversas são 


“Substituir R, por 4R, + R;”, “Substituir R, por 3R, + Ry”, “Substituir R, por 2R, + R,” 
1 0 0||1 0 3]]1 20 
G)B-|0 1 4|jO 1 0/10 1 0 
0 O 1//0 O 1//0 0 1 


(c) (1) Começamos reduzindo C à forma escalonada. Temos 


1 1 2 112 112 
C= 2 3 8j~]O 1 4|~jO 1 4 
=3 = 2 02 8 0 0 0 


A forma escalonada de C tem uma linha nula. “PARE”. A matriz C não pode ser reduzida à matriz identidade 
e C não pode ser escrita como um produto de matrizes elementares. (Em particular, observamos que C não 
possui inversa.) 


1 2 —4 | 3 —4 
3.32 Encontre a inversa de (a) 4=|-1 — 5|,(b) B=|1 5 + 
2 7-3 3 13 —6 


(a) Formamos a matriz M = [A, I] e a reduzimos à forma escalonada. 


1 2 41100 12 41100 
M=|-1-1 5/01 0|-|01 11110 
2 7-3/001] [03 5,/-201 
1 2 -41 1 0 0] 
slr m T £i 
00 2/-5 -3 1 


Na forma escalonada, a metade da esquerda de M está em forma triangular, portanto, A tem uma inversa. Continu- 
amos reduzindo M à forma canônica por linhas. 


1 2 0-9 -6 2 1 0 0—16 =i} 3 

I I 1 

M-|0 10,4 5 —iļ~]0 10, 5 3 oł 
I I 

Ro did dl od sd 4 


A última matriz tem o formato [I, AM, ou seja, A”! é a metade da direita da última matriz. Assim, 


-16 -11 3 

—1 7 S 1 
A = 2 5 73 
o: 

2 2 2 


(b) Formamos a matriz M = [B, I] e a reduzimos à forma escalonada. 


1 3 -41 0 0 13 -4 | 1 0 0 13 411 0 0 
M=|1 5 1,0 1 0|-10 2 3—1 1 Of~ |O 2 3 | -1 1 0 
3 13 -610 0 1 0 4 61-3 0 1 0 0 0—1 -2 1 


Na forma escalonada, M tem uma linha nula na metade da esquerda, portanto, B não pode ser reduzida à forma 
triangular. Por isso, B não tem uma inversa. 
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3.33 Mostre que cada matriz elementar E é invertível e que sua inversa é uma matriz elementar. 


Seja E a matriz elementar correspondente à operação elementar e, ou seja, e(1) = E. Seja e a operação inversa de e 
e E' a matriz elementar correspondente, ou seja, e (1) = E”. Então 


I = e'(e(I)) = e'(E) = E'E e I = e(e'(I)) = e(E') = EE' 


Assim, E' é a inversa de E. 


3.34 Demonstre o Teorema 3.16. Sejam e uma operação elementar com as linhas e E a matriz elementar quadra- 
da de ordem m correspondente, ou seja, e(1) = E. Então e(A) = EA, para qualquer matriz Am x n. 


Seja R, a i-ésima linha de A e escrevamos A = [R,, ..., R,). Se B for um matriz para a qual está definido o produto 
AB, então AB = [R,B, ..., R,B.]. Também escrevemos 


e;=(0,...,0,1,0,...,0), “= 
Aqui, °= i significa que a entrada 1 com circunflexo está na posição i. Mostra-se (Problema 2.46) que e A = R,. Observe 
que I = [e,, e,,...,e,] é a identidade de ordem m. 
G) Seja e a operação elementar “Trocar as linhas R, e R, entre si”. Então, com °= i e î J; 
E = e(I) = |e1,..., 8p., Eny Em] 
e 


Assim, 


EA = bla us] = [Ris Rn Ria Rp] = e(d) 


(ii) Seja e a operação elementar “Substituir R, por kR, (k # 0)”. Então, com °= i, 


inte Em 


E = e(I) = fe}, .. . , ke; 


e(4) = [R;, --., kR, 


ne 


Assim, 


EA = [e,4,...,ke À... €A] = [Ry,...,kR;,...,Ry] = e(4) 


al 


Gii) Seja e a operação elementar “Substituir R, por kR, + R”. Então, com E 


E= ell) = lgj; se ke; + e;, sray Eal 
e 
e(4) = [R;, a kR; + R;, ER i Rm] 


Usando (ke, + e;)A = k(e;A) + e;A = kR, + R;, obtemos 


EA =[e,4, ..., (ke; +e;)A, ..., eml] 
SIR, cs RFR, o R] = e(d) 


3.35 Demonstre o Teorema 3.17. Seja A uma matriz quadrada. Então as afirmativas seguintes são equivalentes. 
(a) A é invertível (não singular). 
(b) A é equivalente por linhas à matriz identidade 7. 
(c) A é um produto de matrizes elementares. 


Suponha que A seja invertível e equivalente por linhas a uma matriz B em forma canônica. Então existem matrizes 
elementares E,, E, ..., E, tais que E, . . . E,E,4 = B. Como A e cada matriz elementar E, são invertíveis, também 
B é invertível. No entanto, se B  T, então B teria uma linha nula e, portanto, não seria invertível. Logo B = I e (a) 
implica (b). 
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Se valer (b), existem matrizes elementares E,, E, ..., E, tais que E ...EE/A=T. Logo, 


=j Sina a: = so au ; TE 

A = (E, ... EE) = EȚ'E3! ..., E7! Como as E;! também são matrizes elementares, (b) implica (c). 

Se vale (c), então 4 = EE; . . . E, e, como as E, são matrizes invertíveis, seu produto A também é invertível. Logo, 
(c) implica (a). Dessa forma, demonstramos o teorema. 


3.36 Demonstre o Teorema 3.18. Se AB = J, então BA = Te, portanto, B = A`”. 


Suponha que A não seja invertível. Então A não é equivalente por linhas à matriz identidade 7 e, portanto, A é equi- 
valente por linhas a uma matriz com uma linha nula. Em outras palavras, existem matrizes elementares E, ..., E, 
tais que E, . . . E,E,A tem uma linha nula. Segue que a matriz invertível E, . . . EE, 4B = E,...E,E, tem uma 
linha nula. Como matrizes invertíveis não podem ter linhas nulas, isso mostra que A é invertível, com inversa A”. 


Então também 


B = IB = (AT'A)B = A`! (AB) = AT'I = A7! 


3.37 Demonstre o Teorema 3.19. B é equivalente por linhas a A (e escrevemos B ~ 4) se, e só se, existe uma 
matriz não singular P tal que B = PA. 


Se B ~ A, então B = e,(. . . (e,(e,(4))) ---) = E, . . . E2E,A = PA, onde P = E, . . . EE, é não singular. Reci- 
procamente, suponha que B = PA, com P não singular. Pelo Teorema 3.17, P é um produto de matrizes elementa- 
res, portanto, B pode ser obtido a partir de A com uma sequência de operações elementares com as linhas, ou seja, 
B ~ A. Dessa forma, demonstramos o teorema. 


3.38 Demonstre o Teorema 3.21. Cada matriz m x n A é equivalente a uma única matriz em blocos da forma 


Ê o} em que 1, é a matriz identidade de ordem r. 


A demonstração é construtiva, no formato de algoritmo. 


Passo 1 Reduza A à forma canônica por linhas, com entradas líderes não nulas a; jo Djs Am 
. à a 1. !B 
Passo 2 Troque entre si as colunas C, e Cj, C, € C5,,..., C, e Cp. Disso resulta uma matriz da forma Hei E 
com entradas líderes não nulas 411, 422, + + + s Arr- l 


Passo 3 Utilize operações com as colunas e os pivôs a, para trocar cada entrada de B com um zero, ou seja, para 
i=),2,.,rej=r+1, f + 2, ..., n efetue a operação =b; + C > C. 


A matriz final tem o formato k | à! procurado. 
l 


Fatoração LU 
1 -3 5 1 4 -3 
3.39 Encontre a fatoração LU de (a) A = 2 —4 7|,@b) B= 2 8 1 
-1 -2 1 -5 -9 7 


(a) Reduzimos A à forma triangular com as operações 
“Substituir R, por -2R, + R$”, “Substituir R, por R, + R;” e, então, 
“Substituir R, por ŠR, + R3?” 


Denotando a forma triangular por U, essas operações fornecem 


1 -3 5 1 -3 5 1 00 
AS|0O 2 3|~ļ]0 2 3|=U e L=|2 10 
0 -5 6 0 0 —5 -1 21 


As entradas 2, —1, — 5 de L são os simétricos dos multiplicadores —2, 15 das operações com as linhas utilizadas. 
(Para conferir, multiplique L por U e obtenha A = LU.) 
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(b) Reduzimos B à forma triangular com as operações “Substituir R, por -2R, + R,”, “Substituir R, por 5R, + R$”. 
Essas operações fornecem 


1 4 -3 
B-|0 0 7 
0 11 —8 


Observe que a segunda diagonal é 0. Assim, B não pode ser levado à forma triangular sem utilizar troca de linhas. 
Por isso, B não tem fatoração LU. (Existe uma fatoração PLU desse tipo de matrizes, em que P é uma matriz de 
permutação, mas essa fatoração não está ao alcance de nossos métodos.) 


3.40 Encontre a fatoração LDU da matriz A do Problema 3.39. 
A fatoração LDU se refere ao caso em que L é uma matriz triangular inferior com entradas 1 na diagonal (como na 
fatoração LU), D é uma matriz diagonal e U é uma matriz triangular superior com entradas 1 na diagonal. Assim, 
simplesmente separamos as entradas da diagonal da matriz U da fatoração LU de A obtida no problema precedente 
e obtemos as matrizes D e U, como segue. 


1 0 0 1 0 0 1 —3 5 

L=| 2 d MW. b= lo 2 ol, V=|0 1 -3 

ei. = À 0 0 = 0 0 1 
1 21 
3.41 Encontre a fatoração LU da matriz 4 = 2 3 3 
—3 =10 2 


Reduzimos A à forma triangular com as operações 


(1) “Substituir R, por -2R, + R$”, (2) “Substituir R, por 3R, + R$”, (3) “Substituir R, por —4R, + R$” 


Denotando a forma triangular por U, essas operações fornecem 


1 2 1 1 2 l 1 0 0 
A-|0 -1 1/10 -1 1| =U e L= 2 10 
0 —4 5 0 01 -3 4 1 


As entradas 2, —3, 4 de L são os simétricos dos multiplicadores —2, 3, —4 das operações com as linhas utilizadas. 
(Para conferir, multiplique L por U e obtenha A = LU.) 


3.42 Seja A a matriz do Problema 3.41. Encontre X,, X,, X}, sendo X, a solução de AX = B, nos casos (a) B, = 
(1, 1, 1), (b) B, = B, + X,, (c) B; = B, + X. 


(a) Encontramos L'B, aplicando em B, as operações com as linhas (1), (2) e, depois, (3) dadas no Problema 3.41. 


1 1 1 
maJ Deo, o fi 
1 4 8 


Substituindo para trás, resolvemos UX = B com B = (1, —1, 8) para obter X, = (-25, 9, 8). 
(b) Inicialmente, encontramos B, = B, +X; = (1,1,1) + (—25, 9, 8) = (—24, 10, 9). Então, como antes, 


O e O, pas pose aos 


B, = [—24, 10,9)” 


Substituindo para trás, resolvemos UX = B com B = (-24, 58, —295) para obter X, = (943, -353, -295). 
(c) Inicialmente, encontramos B; = B, + X, = (—24, 10,9) + (943, —353, —295) = (919, —343, —286). Então, 
como antes, 


(3) 


e ©, (919, —2181,2671]7 — 2, [919, —2181, 11 395)” 


1 
B, = [943, —353, —295]7 £ 
Substituindo para trás, resolvemos UX = B com B = (919, -2181, 11395) para obter 


X, = (-37628, 13576, 11395). 
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Problemas variados 


3.43 Seja L uma combinação linear das m equações com n incógnitas do sistema (3.2). Digamos que L seja a 
equação 


(cantam +e H (Cain HiH Cnam) Xn = Cibi Hee H Cnh a) 


Mostre que qualquer solução de (3.2) também é uma solução de L. 
Seja u = (k,, ..., k,) uma solução de (3.2). Então 


anky + apho +--+ ank, =D; (1=1,2,...,m) (2) 


Substituindo u no lado esquerdo de (1) e usando (2), obtemos 


(cian ER Comi )ky pets (cian prsia Cmamn)kn 
= cq (akı ease + anka) aeee A Cm(amıkı Peret amaka) 
= cibi ++ pbn 


Esse é o lado direito de (1), portanto, u é uma solução de (1). 


3.44 Suponha que um sistema A de equações lineares tenha sido obtido de um sistema .Z por uma operação 
elementar (página 69). Mostre que M e Z têm as mesmas soluções. 


Cada equação L de ./ é uma combinação linear de equações de Y. Logo, pelo Problema 3.43, qualquer solução 
de Z também é solução de .d/. Por outro lado, cada operação elementar tem uma operação inversa, de modo que 
L pode ser obtido a partir de ./ por uma operação elementar. Isso significa que qualquer solução de M é uma 
solução de Z. Assim, Z e M têm as mesmas soluções. 


3.45 Demonstre o Teorema 3.4. Suponha que um sistema ⁄ de equações lineares seja obtido de um sistema Z 
de equações lineares por uma sequência finita de operações elementares. Então M e Z têm as mesmas so- 
luções. 

Cada passo da sequência mantém inalterado o conjunto solução (Problema 3.44). Assim, o sistema original Z e o 
sistema final .4/ (bem como qualquer sistema intermediário) têm as mesmas soluções. 


3.46 Dizemos que um sistema de equações lineares Z é consistente se nenhuma combinação linear de suas equa- 
ções é uma equação degenerada L de termo constante não nulo. Mostre que Z é consistente se, e só se, Z 
for redutível à forma escalonada. 


Suponha que .Z seja redutível à forma escalonada. Então X tem alguma solução, que também deve ser uma solu- 
ção de cada combinação linear de suas equações. Assim, L, que não tem soluções, não pode ser uma combinação 
linear das equações de S. Assim, Z é consistente. 

Por outro lado, suponha que Z não seja redutível à forma escalonada. Então, no processo de redução, deve surgir 
alguma equação degenerada L com termo constante não nulo que é uma combinação linear das equações de S. 
Assim, Z não é consistente. 


3.47 Suponha que u e v sejam vetores distintos. Mostre que os vetores u + a(u — v) são distintos para escalares 
a distintos. 


Suponha que u + a(u — v) = u + a,(u — v). Basta mostrar que a, = a,. Temos 
au — v) = axu — v), portanto, (a, — au — v) = O 
Como u e v são distintos, u — v Æ 0. Assim, a, — a, = 0 e, portanto, a, = a,. 
3.48 Suponha que AB esteja definido. Demonstre as afirmações seguintes. 


(a) Se A tiver uma linha nula, então AB tem uma linha nula. 


(b) Se B tiver uma coluna nula, então AB tem uma coluna nula. 
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(a) Sejam R, a linha nula de A e C,, C,, ..., C, as colunas de B. Então a enésima linha de AB é 
(RC, R;C,,...,R;C,) = (0,0,0,...,0) 


(b) B” tem uma linha nula, portanto, BA = (AB)” tem uma linha nula. Logo, AB tem uma coluna nula. 


Problemas Complementares 


Equações lineares, sistemas 2 x 2 
3.49 Decida quais dos sistemas seguintes são lineares. 
(a) 3x—-4y+2yz=8,(b) ex+3y =n, (c) 2x—-3y+hkz=4 


3.50 Resolva (a) nx = 2, (b)3x+2=5x+7-2x,(c)6x+2—-4x=5+2x—3 


3.51 Resolva cada um dos sistemas seguintes. 
(a) 2x+3y=1 (b) 4x —-2y=5 (c) 2x—-4=3y (d) 2x— 4y = 10 
5x +7y=3 —6x+3y=1 5y—-x=5 3x— 6y = 15 


3.52 Considere os sistemas seguintes nas incógnitas x e y. 


(a) x-ayp=1 (b) ax+3y=2 (c) x+ay=3 
ax — 4y =b 12x + ay = b 2x + 5y =b 


Para quais valores de a o sistema dado tem solução única e para quais pares de valores (a, b) o sistema tem 
mais do que uma solução? 


Sistemas de equações lineares gerais 


3.53 Resolva. 


(a) x+ y+ 2z= 4 (b) x-2y+ 3z=2 (c) x+2y+ 3z= 3 
2x+3y+ 6z=10 2x — 3y+ 82=7 2x+3y+ 82= 4 
3x + 6y + 102 = 17 3x — 4y + 13z = 8 5x + 8y + 19z = 11 


3.54 Resolva. 


(a) x-2y=5 (b) x+2y-3z+2t=2 (o) x+2y+4z-5t=3 
2x+3y=3 2x + 5y — 8z + 6t=5 3x— y+5z+2t=4 
3x+2y=7 3x + 4y — 5z+2t=4 5x — 4y +62 + 9t =2 


3.55 Resolva. 


(a) 2x— y-4z=2 (b) x+2y— z+3t= 3 
4x — 2y- 62=5 2x+4y+42+3t= 9 
6x — 3y — 8z = 8 3x+6y— z+8t=10 


3.56 Considere os sistemas seguintes nas incógnitas x, y e z. 


(a) x—2y =1 b) x+ 2y+22=1 (o) x+ y+az=1 
x— y+az=2 x+ ay+32=3 x+ayp+ z=4 
ay+9z =b x+ lly +az= b ax+ y+ z=b 


Para quais valores de a o sistema dado tem solução única e para quais pares de valores (a, b) o sistema tem 
mais do que uma solução? O valor de b não influi no sistema ter, ou não, solução única. Por quê? 
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Combinações lineares, sistemas homogêneos 


3.57 Escreva v como uma combinação linear de u,, u,, Uz, com 
(a) v= (4,—9,2), u =(1,2,—1), w=(1,4,2), u= (1,-3,2); 
Œ) v= (1,3,2), u = (1,2,1), u = (2,6,5), u = (1,7,8); 
(o) v= (1,4,6), u = (1,1,2), u = (2,3,5), u, = (3,5,8). 


3.58 Sejam u, = (1, 1, 2), u, = (1, 3, —2), u, = (4,-2,-1) de Rº. Mostre que u,, u,, U3 São ortogonais e escreva v 
como uma combinação linear de u,, u,, u, se (a) v = (5, 5,9), (b) v = (1,-3,3), (a) v = (1,1, 1). (Sugestão: 
use coeficientes de Fourier.) 


3.59 Encontre a dimensão e uma base do conjunto solução W de cada um dos sistemas homogêneos seguintes. 


(a) x—-y+272=0 (b) x+2y-32=0 (c) x+2y+ 32+ t=0 
2x+y+ z=0 2x+5y+22=0 2x+4y+ 72 +44=0 
5x+y+42=0 3x— y—-42=0 3x + 6y + 102+5t=0 


3.60 Encontre a dimensão e uma base do conjunto solução W de cada um dos sistemas seguintes. 


(a) x+ 3w+ 2x,- x4- x5=0 (b) 2x) — 4x, +3x,)— x + 2x,5=0 
2x1 6x, 5x3 +x4 — x5=0 3x — 6x, + 5x3 — 2x4 + 4x; =0 
5x, + 15x, + 12x3 + x4 — 3x5 = 0 5x, — 10x, + 7x3 — 3x4 + 18x; = 0 


Matrizes escalonadas, forma canônica por linhas 


3.61 Reduza cada uma das matrizes seguintes à forma escalonada e depois à forma canônica por linhas. 


11 2 Lar da 242 -2 51 
ty l2 4 dl dy |24 12 5|), to 362 2 04 
1 5 12 3 6 3 -77 482 6 -57 


3.62 Reduza cada uma das matrizes seguintes à forma escalonada e depois à forma canônica por linhas. 


1212 1 2 dd 3 3i 3 
2435 5 7 03812 2 8 5 10 
O lag 4a sã up loga b © |i 771 
1243 6 9 02 710 3 11 7 15 


3.63 Usando somente entradas 0 e 1, apresente todas as possíveis matrizes 2 x 2 em forma canônica por linhas. 


3.64 Usando somente entradas O e 1, encontre o número n de todas as possíveis matrizes 3 x 3 em forma canônica 
por linhas. 


Matrizes elementares, aplicações 


3.65 Sejam e,, €,, e, respectivamente, as operações elementares com as linhas seguintes. 


“Trocar as linhas R, e R, entre si”, “Substituir R, por 3R,” e “Substituir R, por 2R, + R,” 
(a) Encontre as matrizes elementares E,, E,, E, correspondentes. 


(b) Encontre as operações inversas e7 !, e; !, e; !; suas matrizes elementares E! , E), E; correspondentes e a 
relação entre essas matrizes e E,, E,, E3. 


(c) Descreva as operações elementares f,, fa, f3 com as colunas. 


(d) Encontre matrizes elementares F, F,, F, correspondentes a f,, f), f, e a relação entre essas matrizes e E ,, 
E, E, 
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3.66 Expresse cada uma das matrizes seguintes como um produto de matrizes elementares. 


1 0 
12 3 —6 2 6 
eka a=[3 8 c-[2 9 o-[ois 
3 7 
3.67 Encontre a inversa de cada uma das matrizes seguintes (se existir). 

1 -2 —1 1 2 3 1 3 2 2 1 —1 
A=|2 3 1), íB=|2 6 1), íC=|28 3|, D=]|5 2 =3 
3 —4 4 3 10 =l 1:7 1 0 2 1 


3.68 Encontre a inversa de cada uma das matrizes n x n seguintes. 


(a) A tem entradas 1 na diagonal e na superdiagonal (as entradas imediatamente acima da diagonal) e zeros 
nas demais entradas. 


(b) B tem entradas 1 na diagonal e acima da diagonal e zeros nas demais entradas. 


Fatoração LU 
3.69 Encontre a fatoração LU das matrizes seguintes. 
1 -1 -1 1 3 — 23 6 12 3 
(a) {3 —4 -2|,(@) |2 5 1|,@©@ |4 79|,(d |2 4 7 
2 -3 -2 34 2 3 5 4 3 7 10 
3.70 Seja A a matriz do Problema 3.69(b). Encontre X,, X,, X3, X,, sendo 
(a) X, é a solução de AX = B,, com B, = (1,1, Dn”. 
(b) Para k > 1, X, é a solução de AX = B com B, = B,- FX -e 
3.71 Seja B a matriz do Problema 3.69(b) Encontre a fatoração LDU de B. 
Problemas variados 
3.72 Considere o sistema seguinte de incógnitas x e y. 
ax+by= 1 ax + by = 0 
(a) cx+dy=0 (b) cxt+dy=1 


Suponha que D = ad — bc + 0. Mostre que cada sistema tem a solução única 
(a) x=d/D,y=-c/D, (b) x=-b/D,y=a/D. 


3.73 Encontre a inversa da operação com as linhas “Substituir R, por kR; + k'R; (k' £ 0). 


3.74 Demonstre que suprimindo a última coluna de uma forma escalonada (respectivamente, da forma canônica) 
de uma matriz aumentada M = [A, B] resulta um sistema em forma escalonada (respectivamente, em forma 
canônica) de A. 


3.75 Sejam e uma operação elementar com as linhas e E sua matriz elementar associada, f a operação com as 
colunas correspondente e F sua matriz elementar. Demonstre que 


@ SA) = (e4), O F=E7, (0) fA=4r. 
3.76 A matriz A é equivalente à matriz B, e escrevemos 4 = B, se existirem matrizes não singulares P e Q tais que 


B = PAQ. Demonstre que ~ é uma relação de equivalência, ou seja, que valem 


(a) AxA, (b) SeA 7B, então B xA, (c) SAxB e Bx cC, então A x C. 
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Respostas dos Problemas Complementares 


Notação A = [R,; R,; ... ] denota a matriz A de colunas R,, R,, ... Os elementos de cada linha são separados por 
vírgulas (que podem ser omitidas no caso de números de um algarismo), as linhas são separadas por ponto e vírgu- 
la e O denota uma linha nula. Por exemplo, 


1 23 4 
=[1,2,3,4; 5,-6,7,-8; 0]=|5 -6 7 -8 
0 0 0 0 
3.49 (a) não é, (b) é, (c) é linear em x, y, z, mas não em x, y, z, k. 
3.50 (a) x = 2/7, (b) não tem solução (c) qualquer escalar é uma solução 
3.51 (a) (2,-1), (b) não tem solução (c) (5, 2), (d) (5 — 2a, a) 
3.52 (a) a + +2, (2,2), (—2, —2), (b) a +6, (6,4), (—6, —4), (c) a f >, (5,6) 
3.53 (a) (2, 1,4), (b) não tem solução, (c) u = (-7a — 1, 2a + 2, a) 
3.54 (a) (3, —1), (b) u = (ca + 2b, 1 + 2a — 2b, a, b), (c) não tem solução. 
3.55 (a) u = Ga+2, a, 5, b) u= G (7 — 5b — 4a), a, o! +b), b) 
3.56 (a)a Æ +3, (3,3), (-3,-3), b) a#5 e aZ-l, (5,7), (—1,—5), 
(Ja fl e af-, (2,5) 
3.57 (a)2,-1,3, (b) 6, -3, 1, (c) não é combinação linear 
3.58 (a) 3,-2, 1, 6)5, -1,5 (05737 
3.59 (a) dim W = 1, u, = (-1, 1, 1), (b) dim W = 0, não tem base, 
(c) dim W = 2, u, = (-2, 1, 0, 0), u, = (5,0,-2, 1) 
3.60 (a)dim W = 3, u, = (-3, 1, 0, 0, 0), u, = (7, 0, — 2 0), u, = (3, 0, —1, 0, 1), 
(b) dim W = 2, u, = (2, 1, 0, 0, 0), u, = (5, 0, -5, — 3, 1) 
3.61 (a)[1,0,— T Bl: 0], (b) [1,2,0,0,2; 0,0,1,0,5; 0,0,0,1,2], 
(c) [2,04 5,3; 0,0,1, -5,5 —3; 0] 
3.62 (a)[l,2,0,0,—4,-2; 0,0,1,0,1,2; 0,0,0,1,2,1; O], 
(b) [0,1,0,0; 0,0,1,0; 0,0,0,1; 0J, (c) [1, 0,0,4; 0, 1,0,-—1; 0,0, 1, 2; 0] 
3.63 5;[1,0; 0,1], [1,1; 0,0], [1,0; 0,0], [0,1; 0,0], O 
3.64 16 
3.65 (a) [1,0,0; 0,0,1; 0,1,0],[1,0,0; 0,3,0; 0,0,1], [1,02; 0,1,0; 0,0,1], 
(b) Ro RB; R, >R); 2R, +R; > R; cada E; = E/, 
(0) G e G,30 > C,2CG +C >C, (d) cada F; = E7. 
3.66 4=[1,0; 3,1][1,0; 0,-2][1,2; 0,1], B não é invertível, 
C= |10; —ż , 1][1,0; 0,2][1,6; 2,0; 0,1), 
D=[100; 010; 301][100; 010; 021][100; 013; 001][120; 010; 001] 
3.67 A`! = [-8,12,-5; 5,7,-3; 1,-2,1], B não tem inversa, 
= = Hi; EA 5; 3, 2,1], z = [8,=3,-1; —5,2,1; 10, —4, —1] 


3.68 


3.69 


3.70 


3.71 


3.73 


3.75 


3.76 
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A“! = [1,—1,1,—1,...; 0,1,—1,1,—1,.. 


5 0,0,1,-—1,1, 


B` tem entradas 1 na diagonal, —1 na superdiagonal e O no resto. 


(a) [100; 310; 211[1,-1,-1; 0,-1,1; 0,0,-1), 
(b) [100; 210; 351[1,3,-1; 0,-1,3; 0,0,-10), 
(c) [100; 210; 347»1]]2,3;6; 0,1,-3; 0,0, 3), 


(d) Não há fatoração LU 


—1,1,...; 


X, =[1,1,—1]", B=[,20, X, = [6,4,0], B,=[8,6,0/, X, = [22,16,-2], 


B, = [30,22,-2]", X, = [86, 62, —6]" 
B=[100; 210; 351] diag(1, —1,—10) [1,3,-1 
Substituir R, por —kR; + (1/k')R;. 

(0) H4) = (e(4"))" = (EAT) = (AP E" = AF 


(a) A = IAI. (b) Se A = PBO, então B = P'AQ! 
(c) Se A = PBQ e B = P'CQ', então 4 = (PP')C( 


; 0,1,3; 


0'0). 


0,0, 1] 


Capítulo 4 


Espaços Vetoriais 


4.1 INTRODUÇÃO 


Neste capítulo introduzimos a estrutura básica da Algebra Linear, que é a do espaço vetorial de dimensão finita. A 
definição de um espaço vetorial V, cujos elementos são denominados vetores, envolve um corpo K arbitrário, cujos 
elementos são denominados escalares. Adotamos a notação seguinte (salvo menção em contrário). 


V o espaço vetorial dado 
u, v, W vetores de V 
K o corpo numérico dado 
a,b,c ouk,r escalares de K 


Quase nada de essencial se perde considerando que K seja o corpo real R ou o corpo complexo C. 
. . . pa . 2 . as . 
O leitor deve suspeitar que a reta real R tem “dimensão” um, que o plano cartesiano Rº tem “dimensão” dois e 


3 . A A 2 . o . E 
que o espaço R` tem “dimensão” três. Neste capítulo formalizamos essa noção de “dimensão”, que comprova a 
intuição do leitor. 


Ao longo deste livro utilizamos a notação de conjuntos apresentada a seguir. 
acA O elemento a pertence ao conjunto A 
abe 4 Os elementos a e b pertencem ao conjunto A 

Vx EA Para cada x de A 
Ix EA Existe algum x de A 
ACB A é um subconjunto de B 
ANB A interseção de A e B 
AUB A união de A e B 

ø O conjunto vazio 


4.2 ESPAÇOS VETORIAIS 


A noção de espaço vetorial V sobre o corpo K de escalares é definida como segue. 


DEFINIÇÃO Seja V um conjunto não vazio com as duas operações seguintes. 


(G) Adição de vetores Associa a quaisquer u, v € V a soma u + vem V. 
Gi) Multiplicação por escalar Associa a quaisquer u € V, r € K o produto ru € V. 


Então dizemos que V é um espaço vetorial (sobre o corpo K) se os axiomas seguintes forem verdadeiros. 
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[A,] Para quaisquer vetores u, v we V, (u + v) + w =u + (v + w). 

[A,] Existe um vetor em V, que denotamos 0 e denominamos vetor nulo, ou vetor zero, tal que 
u + 0 = u = 0 + u, para qualquer vetor u € V. 

[A,] Para cada vetor u € V existe um vetor em V, que denotamos —u e denominamos simétrico de u, 
tal que 


u + (u) = 0 = (u) + u. 


[A,] Para quaisquer vetores u, ve V, u +v =v + u. 

[M,] Para quaisquer vetores u, ve V e escalar re K, r(u + v) = rv + ru. 
[M,] Para quaisquer escalares a, be K e vetor u € V, (a + b)u = au + bu. 
[M,] Para quaisquer escalares a, be K e vetor u € V, (ab)u = a(bu). 

[M,] Para qualquer vetor u e V, lu = u, onde 1 é o escalar unitário de K. 


m o oo e 


Esses oito axiomas se dividem naturalmente em duas partes (conforme indicamos nos rótulos). Os quatros 
primeiros dizem respeito somente à estrutura aditiva de V e podem ser resumidos dizendo que V é um grupo comu- 
tativo na adição. Isso significa que 


(a) Qualquer soma finita v, + v, +: + Vm de vetores dispensa o uso de parênteses e independe da ordem das par- 
celas. 

(b) O vetor nulo O é único, bem como o simétrico —u de cada vetor u. 

(c) (Lei do Cancelamento) Se u + w = v + w, então u = v. 


Também definimos a subtração em V por u — v = u + (-v), em que — é o único simétrico de v. 

Por outro lado, os outros quatro axiomas dizem respeito à “ação” do corpo K de escalares sobre o espaço veto- 
rial V. Usando esses axiomas, demonstramos (Problema 4.2) as propriedades simples de um espaço vetorial que 
seguem. 


Teorema 4.1 Seja Vum espaço vetorial sobre um corpo K. 


(i) Para qualquer escalar re Ke0 € V,r0 = 0. 

(11) Para 0 € K e qualquer vetor u € V, Ou = 0. 
(iii) Se ru = 0, com re Keue V, entãor = 0 ou u = 0. 
(iv) Para quaisquer re Keue V, (ru = r(-u) = —ru. 


4.3 EXEMPLOS DE ESPAÇOS VETORIAIS 


Nesta seção apresentamos exemplos de importantes espaços vetoriais que serão utilizados ao longo de todo o texto. 


Espaço K” 


Seja K um corpo arbitrário. Frequentemente utilizamos a notação K” para o conjunto de todas as ênuplas de ele- 
mentos de K. Esse conjunto K” é um espaço vetorial sobre K com as operações seguintes. 


(i) Adição de vetores (a4, a3, ...,a„) + (b1, b2,...,b,) = (a +b1, a +b,,..., ap +b) 
(ii) Multiplicação por escalar k(a;, az, . . . ,a„) = (kay,kas,...,ka,) 


O vetor nulo de K” é a ênupla de zeros, 
0 = (0, 0, ..., 0) 

e o simétrico de um vetor é definido por 
—(a,,a,,...,a,)) = (—41, —43, . - - , —4,) 


Observe que essas são as mesmas operações já definidas para R” no Capítulo 1. A demonstração de que K” é um 
espaço vetorial é idêntica à demonstração do Teorema 1.1 e, agora, podemos afirmar que R”, com as operações lá 
definidas, é um espaço vetorial sobre R. 
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Espaço polinomial P(t) 


Seja P(t) o conjunto de todos os polinômios da forma 


pl =a tat +a P + Hat (8=1,2,e00) 


em que os coeficientes a, pertencem ao corpo K. Então P(t) é um espaço vetorial sobre K utilizando as operações 
seguintes. 


(i) Adição de vetores A soma p(t) + q(t) de P(t) é a operação de soma usual de polinômios. 
(ii) Multiplicação por escalar O produto kp(t) de P(t) é a operação de multiplicação usual de um escalar k e um poli- 
nômio p(t). 


O polinômio zero é o vetor nulo de P(t). 


Espaço polinomial P (t) 


Seja P (f) o conjunto de todos os polinômios p(t) sobre um corpo K de grau menor do que ou igual a n, ou seja, 
pt) =a tatta at 


com $ < n. Então P(t) é um espaço vetorial sobre K em relação às operações usuais de soma de polinômios e de 
multiplicação de polinômios por uma constante (exatamente como no espaço vetorial P(t) precedente). Incluímos 
o polinômio zero O como um elemento de P (1), mesmo que não tenha grau algum. 


Espaço matricial M,, , 


A notação M, „ ou, simplesmente, M, é utilizada para denotar o conjunto de todas as matrizes m x n com entradas 
de um corpo K. Então M, , é um espaço vetorial sobre K em relação às operações usuais de soma matricial e de 
multiplicação de matrizes por escalares, conforme indicado no Teorema 2.1. 


Espaço funcional F(X) 


Sejam X um conjunto não vazio e K um corpo qualquer. O conjunto de todas as funções de X em K é denotado por 
F(X). [Observe que F(X) não é vazio, pois X não é vazio.] Então F(X) é um espaço vetorial sobre K em relação às 
operações seguintes. 


(G) Adição de vetores A soma de duas funções fe g de F(X) é a função f + g de F(X) definida por 
HDS) ea) Mex 


Gi) Multiplicação por escalar O produto de um escalar k € K e uma função f de F(X) é a função kf de F(X) definida 
por 


WM=) xex 

O vetor nulo de F(X) é a função nula 0, que leva cada x € X no elemento nulo O € K, ou seja, 
0(x) = 0 Vx E X 

Também, dada qualquer função f de F(X), a função simétrica de fé a função —f de F(X) definida por 
CAE) =-~) Mex 


Corpos e subcorpos 


Suponha que um corpo E seja uma extensão de um corpo K, ou seja, suponha que E seja um corpo que contém K 
como um subcorpo. Então E pode ser visto como um espaço vetorial sobre K com as operações seguintes. 


(1) Adição de vetores A soma u + v em E é a operação de soma usual de E. 
Gi) Multiplicação por escalar O produto ru em E, com re Ke ue E éo produto usual de r e u como elementos de E. 


Assim, os oito axiomas de um espaço vetorial são satisfeitos por E e seu subcorpo K em relação a essas duas operações. 


CaríruLo 4 ° Espaços VETORIAIS —— «EP 


4.4 COMBINAÇÕES LINEARES, CONJUNTOS GERADORES 


Seja V um espaço vetorial sobre um corpo K. Um vetor v de V é uma combinação linear dos vetores u,, u,, ..., u, de 
V se existirem escalares a,, a,, ..., a, em K tais que 


V = AU +Hau, ++ amum 
Alternativamente, v é uma combinação linear de u,, u,, ..., U„ Se existir alguma solução da equação vetorial 
V = XU] + Xu, + F XUm 


em que x,, Xy, ..., x, São incógnitas escalares. 


Exemplo 4.1 (Combinações Lineares em R”) Suponha que queiramos expressar v = (3, 7, —4) de R? como uma 
combinação linear dos vetores 


u = (1,2,3), u, = (2,3, 7), u, = (3,5,6) 


Procuramos escalares x, y, z tais que v = XU; + yu, + zus, ou seja, 


3 1 2 3 x+2y+32= 3 
3|=x|2]+y]3|]+2z]5 ou 2x+3y+52= 7 
—4 3 7 6 3x + 7y + 6z = —4 


sA : 3 z . 2. . 
(Por conveniência, escrevemos os vetores de R” como colunas, porque dessa forma é mais fácil encontrar o sistema 
de equações lineares equivalente.) Reduzindo o sistema à forma escalonada, obtemos 


x+2y+3z= 3 x+2y+32= 3 
-—y— z= 1 e, então, —y— z= 1 
y—-32=-13 — 4z = —12 


Substituindo para trás, obtemos a solução x = 2, y = —4, z = 3. Assim, v = 2u, — 4u, + 3u. 


OBSERVAÇÃO De um modo genérico, a questão de expressar um dado vetor v de K” como uma combinação 


linear de vetores u,, u,, ..., u, de K” é equivalente a resolver um sistema AX = B de equações lineares, onde v é a 
coluna B dos termos constantes e os vetores u; são as colunas da matriz de coeficientes A. Um tal sistema pode ter 
uma única solução (como no exemplo), muitas soluções, ou não ter solução. Esse último caso, o de não ter solução, 
significa que v não pode ser escrito como combinação linear dos vetores u,, Uz, ..., Up 

Exemplo 4.2 (Combinações lineares em P(t)) Suponha que queiramos expressar o polinômio v = 3º +5t-5 
como uma combinação linear dos polinômios 


p= 2+2+1, p= 22+5t+4, p=2+31+6 


Queremos encontrar escalares x, y, z tais que v = xp, + yp + Zp}, ou seja, 


3P+5t-S=n(P4+2+41)+y(2º +5St+ 4) +z +31+6) (*) 


Há duas maneiras de proceder a partir daqui. 
(1) Desenvolvemos o lado direito de (*) e obtemos 
BÊ + 5t — 5 = x? + 2xt +x + 2y + 5yt + 4y + zt + 3zt + 6z 
= (x + 2y + z)Ë + (2x + 5y + 3z)t + (x + 4y + 6z) 


Igualamos os coeficientes de mesmas potências de t e reduzimos o sistema à forma escalonada. 


x+2y+ z= 3 x+2y+ z= 3 x+2y+ z= 3 
2x+5y+32= 5 ou y+ z=-—1 ou y+ 2z=— 
x+4y+62=—S5 2y + 5z = —8 3z = —6 
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O sistema está em forma triangular e tem uma solução. Substituindo para trás, obtemos a solução x = 3, y = 
1, z = —2. Assim, 


v = 3p, + p, — 2P; 


(2) Observamos que a equação (*) é, na verdade, uma identidade na variável t, ou seja, a equação é válida para 
qualquer valor de t. Podemos obter três equações nas incógnitas x, y, z igualando t a três valores quaisquer. 
Por exemplo, 


tomando 1 = 0 em (*), obtemos x+4y+ 62 =-5 
tomando t = 1 em (*), obtemos 4x + lly + 10z=3 
tomando t = —1 em (*), obtemos y+ 4z =- 


Reduzindo esse sistema à forma escalonada e substituindo para trás, novamente obtemos a solução x = 3, y = 
1, z = —2. Assim (de novo), v = 3p, + p, — 2p}. 


Conjuntos geradores 


Seja V um espaço vetorial sobre K. Dizemos que os vetores u,, U>, ..., u, de V geram V, ou que constituem um con- 
junto gerador É v inação li Udo sus ja, isti 

t dor de V, se cada vetor v de V for uma combinação linear dos vetores u,, u, ou seja, se existirem 
escalares vetores a,, q», ..., a, de K tais que 


m?’ 


v=au, +a +: +a 
As observações seguintes decorrem diretamente da definição. 


OBSERVAÇÃO 1 Suponha que u,, 1, ..., u, gerem V. Então, dado qualquer vetor w, os vetores w, Uy, Us, ..., U, 
também geram V. 


n 


OBSERVAÇÃO 2 Suponha que u,, u, ..., u, gerem V e que u, seja uma combinação linear de alguns dos demais 
vetores u. Então esses outros u, sem o vetor u,, também geram V. 


OBSERVAÇÃO 3 Suponha que u,, u,, ..., u, gerem V e que um dos u seja o vetor nulo. Então os demais vetores 
u também geram V. 


Exemplo 4.3 Considere o espaço vetorial V = Rº 


(a) Afirmamos que os vetores seguintes formam um conjunto gerador de R?. 
e, = (1, 0, 0), e, = (0, 1, 0), e, = (0,0, 1) 
Mais precisamente, se v = (a, b, c) é um vetor qualquer de R’, então 
v= ae, + be, + ce, 
(b) Afirmamos que os vetores seguintes também formam um conjunto gerador de R’. 
w =(1,1,1), w, = (1, 1, 0), w, = (1,0,0) 
Mais precisamente, se v = (a, b, c) é um vetor qualquer de Rî, então (Problema 4.62) 


v = (a, b, c) = cw, + (b — cw, + (a — b)w, 


Por exemplo, v = (5, —6, 2) = 2w, — 8w, + llw. 


(c) Podemos mostrar [Problema 3.24(b)] que v = (2, 7, 10) não pode ser escrito como uma combinação linear 
dos vetores 


u, = (1,2, 3), um =(1, SA 5), u, = (1,5,9) 


. x 3 
Por isso, u,, u,, u, não geram R`. 
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Exemplo 4.4 Considere o espaço vetorial V = P (1), que consiste em todos os polinômios de grau <n. 


(a) Claramente, cada polinômio de P(t) pode ser expresso como uma combinação linear dos n + 1 polinômios 


n 


L, P, Ê, st 
Assim, essas potências de t (sendo 1 = P) formam um conjunto gerador de P (t). 
(b) Também podemos mostrar que, dado qualquer escalar c, as n + 1 potências seguintes de t — c, 
1,t— c, (t — DU IV, n (t o" 


(em que (t — o = 1), também formam um conjunto gerador de P (1). 


Exemplo 4.5 Considere o espaço vetorial M = M; », que consiste em todas as matrizes 2 x 2, e as quatro matri- 
zes de M a seguir. 


1 0 01 0 0 0 0 
Ei = Ê I Ey = E a E» = É T E» = fo | 


Claramente, cada matriz A de M pode ser escrita como uma combinação linear dessas quatro matrizes. Por exemplo, 


5 —6 
A= E J =5E, — 6E + 7E,, + 8Ez 


Por isso, as quatro matrizes E ,,, E12, E21, E» geram M. 


4.5 SUBESPAÇOS 


Nesta seção introduzimos a importante noção de subespaço vetorial. 


DEFINIÇÃO Sejam V um espaço vetorial sobre o corpo K e W um subconjunto de V. Então W é um subespaço 
de V se o próprio W for um espaço vetorial sobre o corpo K em relação às operações de V de soma de vetores e de 
multiplicação de vetores por escalar. 


Para mostrar que um conjunto W qualquer é um espaço vetorial, precisamos mostrar que W satisfaz os oito 
axiomas de um espaço vetorial. No entanto, se W for um subconjunto de um espaço vetorial V, então alguns desses 
axiomas valem automaticamente para W, pois já valem para V. Vejamos alguns critérios simples para identificar 
subespaços. 


Teorema 4.2 Seja W um subconjunto de um espaço vetorial V. Então W é um subespaço de V se as duas condi- 
ções seguintes são verdadeiras. 


(a) O vetor nulo O pertence a W. 
(b) Dados quaisquer u, ve W e r € K, (i) a soma u + v € W e (ii) o múltiplo ru e W. 


A propriedade (i) de (b) diz que W é fechado em relação à adição, e a propriedade (ii) de (b) diz que W é fe- 
chado em relação à multiplicação por escalar. Essas duas propriedades podem ser combinadas numa única afirma- 
ção equivalente, como segue. 


(b') Para quaisquer u, v € W,a,b € K, a combinação linear au + bv € W. 


Seja, agora, V um espaço vetorial qualquer. Então automaticamente V contém dois subespaços, o conjunto {0} 
consistindo apenas no vetor nulo e o espaço V todo. Esses são, às vezes, denominados subespaços triviais de V. A 
seguir, alguns exemplos de subespaços não triviais. 


Exemplo 4.6 Considere o espaço vetorial V = R°. 
(a) Seja U o conjunto de todos os vetores de R? cujas entradas são iguais, ou seja, 


U = {(a,b,c):a = b= c} 
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Por exemplo, (1, 1, 1), (-3,-3,-3), (7,7, 7) e (-2,-2, —2) são vetores de U. Geometricamente, U é a reta pela 
origem O e pelo ponto (1, 1, 1), conforme Figura 4-1(a). Claramente, O = (0, 0, 0) pertence a U, porque todas 
as entradas de O são iguais. Além disso, sejam u e v dois vetores arbitrários de U, digamos, u = (a, a, a) e v = 
(b, b, b). Então, dado qualquer escalar re K, também são vetores de U os vetores a seguir. 


u+v=(a+b,a+b,a+b) e ru = (ra, ra, ra) 


Assim, U é um subespaço de R'. 


(b) Seja W um plano pela origem arbitrário de R?, conforme a Figura 4-1(b). Então O = (0, 0, 0) pertence a W, 
porque estamos supondo que W passa pela origem O. Além disso, sejam u e v dois vetores de W. Então u e v 
podem ser interpretados como setas do plano W de ponto inicial na origem O, conforme a Figura 4-1(b). A 
soma u + v e qualquer múltiplo ru de u também são setas do plano W. Assim, W é um subespaço de R°. 


Figura 4-1 


Exemplo 4.7 


(a) SejaV = M, n o espaço vetorial das matrizes n x n. Sejam W, o subconjunto de todas as matrizes triangula- 
res (superiores) e W, o subconjunto de todas as matrizes simétricas. Então W, é um subespaço de V, porque 
W, contém a matriz nula O e W, é fechado em relação à soma de matrizes e à multiplicação por escalar, ou 
seja, a soma e a multiplicação por escalar de tais matrizes triangulares também é triangular. Analogamente, 
W, é um subespaço de V. 

(b) Seja V = P(t), o espaço vetorial dos polinômios. Então o espaço P (t) dos polinômios de grau no máximo n 
pode ser visto como um subespaço de P(t). Seja Q(t) o conjunto de todos os polinômios que possuem apenas 
potências pares de t. Por exemplo, os polinômios seguintes são de Q(f). 


p= 3440 =5* e Pa = 6— TÉ +9 +3? 


(Estamos supondo que qualquer constante k = kº é uma potência par de t.) Então Q(t) é um subespaço de P(1). 


(c) Seja Vo espaço vetorial das funções reais. Então o conjunto W, das funções contínuas e o conjunto W, das 
funções deriváveis são subespaços de V. 
Interseção de subespaços 


Sejam U e W subespaços de um espaço vetorial V. Mostremos que a interseção U N W também é um subespaço de 
V. Claramente, 0 € U e0 € W, pois U e W são subespaços; logo, 0 € U N W. Agora suponha que u e v pertençam 
à interseção U N W. Então u, v € U e u, v € W. Além disso, como U e W são subespaços, dados quaisquer esca- 
lares a,b € K, 


au+bve U e au + bve W 


Assim, au + bv € U N W. Logo, U N W é um subespaço de V. 
O resultado precedente é generalizado como segue. 


Teorema 4.3 A interseção de um número qualquer de subespaços de um espaço vetorial V é um subespaço de V. 
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Espaço solução de um sistema homogêneo 


Considere um sistema AX = B de equações lineares com n incógnitas. Então cada solução u pode ser vista como 
um vetor de K”. Assim, o conjunto solução de um tal sistema é um subconjunto de K”. Suponha, agora, que o siste- 
ma seja homogêneo, isto é, da forma AX = 0. Seja Wo conjunto solução dessa equação. Como AO = 0, o vetor nulo 
0 e W. Além disso, suponha que u e v pertençam a W. Então u e v são soluções de AX = 0, ou seja, Au = 0 e 
Av = 0. Portanto, dados quaisquer escalares a e b obtemos 


A(au + bv) = adu + bAv = a0+b0=0+0=0 


Assim, au + bv pertence a W, por ser uma solução de AX = 0. Decorre disso que W é um subespaço de K”. 
Formalizamos o resultado precedente como segue. 


Teorema 4.4 O conjunto solução W de um sistema homogêneo AX = 0 com n incógnitas é um subespaço de K”. 


Enfatizamos que o conjunto solução de um sistema não homogêneo AX = B não é um subespaço de K”. Na 
verdade, o vetor nulo 0 sequer pertence ao conjunto solução dessa equação. 


4.6 ESPAÇOS GERADOS, ESPAÇO LINHA DE UMA MATRIZ 


Suponha que u,, i, ..., U, Sejam vetores quaisquer de um espaço vetorial V. Na Seção 4.4 vimos que qualquer vetor 
da forma au, + aqu, + `+: + amum em que os a, são escalares, é denominado uma combinação linear de u,, us, 
«» U,: O conjunto de todas essas combinações lineares, denotado por 

ger(u,, Us, ..., Um) ou ger(u,) 


“ea E Ro 


é denominado espaço gerado por u,, us, ..., Up 
Claramente, o vetor nulo O pertence ao ger(u,), pois 


0 = Ou, + Ou, + --- + Ou,, 
Além disso, suponha que v e v' pertençam a ger(u,), digamos, 

v=au, tau +: + apum e v = byu + bzu +--+ + bpm 
Então 


v+ v = (a; + biju + (a, + bz)uz +--> + (am + Dm Jum 


e, dado qualquer escalar k € K, 
kv = kaju; + kazu +-+- + kapim 


Assim, v + v' e kuv também pertencem a ger(u,). Decorre disso que ger(u,) é um subespaço de V. 
Mais geralmente, dado qualquer subconjunto S de V, ger(S) consiste em todas as combinações lineares de ve- 
tores de S ou, se $ = À, ger(S) = (0). Assim, em particular, S é um conjunto gerador de ger(S) (ver Seção 4.4). 
Vale o teorema seguinte, que acabamos de demonstrar parcialmente. 


Teorema 4.5 Seja S um subconjunto de um espaço vetorial V. 


(1) Então ger(S) é um subespaço de V que contém 5S. 
(ii) Se W é um subespaço de V que contém S, então (S) E W. 


A condição (ii) do Teorema 4.5 pode ser interpretada como dizendo que ger(S) é o “menor” subespaço de V 
que contém S. 


Exemplo 4.8 Considere o espaço vetorial V = R'. 


(a) Seja u um vetor não nulo qualquer de Rº. Então ger(u) consiste em todos os múltiplos escalares de u. Geome- 
tricamente, ger(u) é a reta pela origem O e pela extremidade de u, conforme Figura 4-2(a). 
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(a) (b) 


Figura 4-2 


(b) Sejam u e v vetores de R? que não são múltiplos um do outro. Então ger(u, v) é o plano pela origem O e pelas 
extremidades de u e v, conforme Figura 4-2(b). 

(c) Considere os vetores e, = (1,0, 0), e, = (0, 1,0), e, = (0,0, 1) de R°. No Exemplo 4.3(a) vimos que cada vetor 
de R° é uma combinação linear de e p ê» e. Ou seja, €,, €,, e, é um conjunto gerador de R°. Decorre disso que 


ger(e,, €,, €;)) = R°. 


Espaço linha de uma matriz 


Seja A = [a;] uma matriz m x n qualquer sobre um corpo K. As linhas de A, 

R, = (di1, 412-3 An) R, = (51,022, - -< , 02); EEY Rm = (ami; Am2; - -< Amn) 
podem ser vistas como vetores de K” e, portanto, geram um subespaço de K”, denominado espaço linha de A e de- 
notado por lin(A). Temos 


lin (4) = ger(R,,R5,...,Ry) 


b) m 


Analogamente, as colunas de A podem ser vistas como vetores de K” que geram um subespaço de K” denominado 
espaço coluna de A e denotado por col(A). Observe que col(A) = lin(A). 

Lembre-se que as matrizes A e B são ditas equivalentes por linhas, e escrevemos 4 ~ B, se B pode ser obtida 
a partir de A por uma sequência de operações elementares com as linhas. Agora suponha que M seja a matriz obtida 
aplicando uma das operações elementares seguintes a A. 


(1) Trocar R, e R, entre si (2) Substituir R, por kR, (3) Substituir R, por kR, + R, 


Então cada linha de M ou é uma linha de A ou é uma combinação linear de linhas de A. Assim, o espaço linha de M 
está contido no espaço linha de A. Por outro lado, podemos aplicar as operações elementares inversas a M para 
obter A; portanto, o espaço linha de A está contido no espaço linha de M. Isso mostra que 4 e M têm o mesmo es- 
paço linha. Isso vale cada vez que aplicarmos uma operação elementar com as linhas. Assim, demonstramos o 
teorema seguinte. 


Teorema 4.6 Matrizes equivalentes por linhas têm o mesmo espaço linha. 


Agora estamos em condições de demonstrar (Problemas 4.45-4.47) resultados básicos relativos à equivalência 
por linhas (que apareceram pela primeira vez nos Teoremas 3.7 e 3.8 do Capítulo 3). 


Teorema 4.7 Sejam A = [a] e B = [b] duas matrizes escalonadas equivalentes por linhas com respectivas en- 
tradas pivô 


aijo Lj,» Pes Arj, e bik Do» aeg bsk 


s 


Então A e B têm o mesmo número de linhas não nulas, ou seja, r = s, e as entradas pivô estão nas mesmas posições, 
ou seja, ji = kij = ko, 3j, = k, 
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Teorema 4.8 Sejam A e B matrizes em forma canônica por linhas. Então A e B têm o mesmo espaço linha se, e só 
se, A e B têm as mesmas linhas não nulas. 


Corolário 4.9 Toda matriz A é equivalente por linhas a uma única matriz em forma canônica por linhas. 


No próximo exemplo utilizamos esses resultados. 


Exemplo 4.9 Considere os dois conjuntos de vetores de Rº dados a seguir. 


u1 = (1,2,-1,3), u, = (2,4, 1, —2), us = (3,6,3, —7) 
w = (1,2, —4, 11), w, = (2,4, —5, 14) 


Sejam U = ger(u;)e W = ger(w,). Há duas maneiras de mostrar que U = W. 

(a) Mostramos que cada u, é uma combinação linear de w, e w, e, depois, que cada w; é uma combinação linear 
de u,, u,, us. Observe que, para isso, devemos mostrar que são consistentes seis sistemas de equações linea- 
res. 

(b) Formamos a matriz A cujas linhas são u,, u,, u, e reduzimos A à forma canônica por linhas, formamos a ma- 
triz B cujas linhas são w, e w, e reduzimos B à forma canônica por linhas, como segue. 


12 -1 3 1 2 = 3 120 t 
4A=|24 1 -2|n|00 3 -8|=-|00 =£ 
3 6 3 -7 0 0 6 -16 000 0 
pah do di 1 2Z2=4 1l 120 1 
Cd =ã 14 00 3 -8 0 01 -$ 


Como as linhas não nulas dessas matrizes em forma canônica por linhas são idênticas, os espaços linha de A e de 
B são iguais. Portanto, U = W. 


Claramente, o método de (b) é mais eficiente do que o método de (a). 


4.7 DEPENDÊNCIA E INDEPENDÊNCIA LINEAR 


Seja V um espaço vetorial sobre um corpo K. As noções de dependência e independência linear de vetores de V 
sobre K são definidas como segue. (Geralmente omitimos a menção a K quando o corpo está subentendido.) Esse 
conceito desempenha um papel essencial na teoria da Algebra Linear e na Matemática em geral. 


DEFINIÇÃO Dizemos que os vetores v,, v,, ..., v, de V são linearmente dependentes se existem escalares a,, a,, 
«.., 4, de K, não todos nulos, tais que 


Vi + aV + + AU = 0 


Caso contrário, dizemos que os vetores são linearmente independentes. 
Podemos reformular essa definição como segue. Considere a equação vetorial 


Xv F Xz + +xavm=0 =) 


em que os x são incógnitas escalares. Essa equação sempre tem a solução nula x, = 0, x, = 0, ..., x, = 0. Suponha 
que essa seja a única solução, isto é, suponha que possamos mostrar que 


Xv F XV + F XmYm = O implica x=0,x,=0,...,x,=0 


Então os vetores v,, v, ..., v, São linearmente independentes. Por outro lado, suponha que a equação (*) possua al- 
guma solução não nula; então os vetores são linearmente dependentes. 

Um conjunto S = {v}, v, ..., v,) de vetores de V é dito linearmente dependente ou independente se os vetores 
Vi, Uz, -.., Up SãO linearmente dependentes ou independentes. 

Um conjunto infinito S de vetores é linearmente dependente ou independente se existirem, ou não, vetores v,, 
V, ..., V, de S que são linearmente dependentes. 
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Atenção Um conjunto S = (w,, v, ..., v,) como dado acima representa uma lista ou, em outras palavras, uma 


m 


sequência finita de vetores que são ordenados e que podem ser repetidos. 


As observações seguintes decorrem diretamente da definição dada. 


OBSERVAÇÃO 1 Suponha que O seja um dos vetores v, v», ..., v,» digamos, v, = 0. Então os vetores são necessa- 
riamente linearmente dependentes, porque temos a combinação linear seguinte em que o coeficiente de v, é não nulo. 


lv +00, +---+00,=1-04+0+:-:+0=0 
OBSERVAÇÃO 2 Suponha que v seja um vetor não nulo. Então v, sozinho, é linearmente independente porque 


kv = 0, vAO implica k=0 


OBSERVAÇÃO 3 Suponha que dois dos vetores v,, v,, ..., v, Sejam iguais, ou que um deles é múltiplo de um ou- 
tro, digamos, v, = kv,. Então os vetores são necessariamente linearmente dependentes, porque temos a combinação 
linear seguinte em que o coeficiente de v, é não nulo. 


uv —kv,+0u+::-+00,=0 
OBSERVAÇÃO 4 Dois vetores v, e v, são linearmente dependentes se, e só se, um deles é um múltiplo do outro. 


OBSERVAÇÃO 5 Se o conjunto (v,, v, ..., v,) for linearmente independente, então qualquer reordenação 
(io Voces v; J de seus vetores ainda será linearmente independente. 


OBSERVAÇÃO 6 Se um conjunto S de vetores for linearmente independente, então qualquer subconjunto de S 
é linearmente independente. Alternativamente, se § contiver um subconjunto linearmente dependente, então S é 
linearmente dependente. 

Exemplo 4.10 

(a) Sejam u = (1,1,0), v = (1,3,2), w = (4,9, 5). Então u, v, w são linearmente dependentes, pois 


3u + 5v — 2w = 3(1,1,0) + 5(1,3,2) — 2(4,9,5) = (0,0,0) = 0 


(b) Mostramos que os vetores u = (1,2,3), v = (2,5,7), w = (1,3, 5) são linearmente independentes. Para isso, 
formamos a equação vetorial xu + yv + zw = 0, em que x, y, z são incógnitas escalares. Isso fornece 


1 2 1 0 x+2y+ z=0 x+2y+ z=0 
x/2|+y|5|47]3] = 10 ou 2x + 5y +3z=0 ou y+ z=0 
3 7 5 0 3x+7y+52=0 22=0 


Substituindo para trás, obtemos x = 0, y = 0, z = 0. Mostramos que 
xu + yv+zw=0 implica x=0,7y=0,7=0 
Assim, u, v, w são linearmente independentes. 


(c) Seja V o espaço vetorial das funções de R em R. Mostremos que as funções ft) = sen t, g(1) = é e hÀ) = Ë 
são linearmente independentes. Para isso, formamos a equação vetorial funcional xf + yg + zh = 0, em que 
x, y, z são incógnitas escalares. Essa equação funcional significa que, para cada valor de t, 


xsent+ye +z =0 


Assim, nessa equação, escolhemos valores apropriados de t para obter x = 0, y = 0, z = O facilmente. Por 


exemplo, 

(1) Substituindo 1 = O obtemos x(0) + y(1) + z(0) = O ou y=0 
(ii) Substituindo t = 7 obtemos x(0) + O0(e”) + z(n?) = 0 ou z=0 
Gii) Substituindo t = 7/2 obtemos x(1) + 0(e”/2) + 0(72/4) = 0 ou x=0 
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Mostramos que 
xf+yg+zh=0 implica x=0,y=0,7=0 


Assim, f, g, h são linearmente independentes. 


Dependência linear em Rº 
A dependência linear no espaço vetorial V = Rº pode ser descrita geometricamente como segue. 


(a) Dois vetores quaisquer u e v de RÌ são linearmente dependentes se, e só se, estão na mesma reta pela origem O, 


conforme Figura 4-3(a). 
(b) Três vetores quaisquer u, v, w de R° são linearmente dependentes se, e só se, estão no mesmo plano pela origem O, 


conforme Figura 4-3(b). 


. . . é . . 
Adiante poderemos mostrar que quatro ou mais vetores quaisquer de R` são automaticamente linearmente dependentes. 


D, 


Ú a 


(a)u e v são linearmente dependentes (b) u, v,w são linearmente dependentes 


Figura 4-3 


Dependência linear e combinações lineares 


As noções de dependência linear e combinações lineares estão relacionadas de perto. Mais precisamente, para mais 
do que um vetor, mostramos que os vetores v,, Vy, ..., Up São linearmente dependentes se, e só se, algum deles é uma 
combinação linear dos demais. 

Suponha, por exemplo, que v, seja uma combinação linear dos demais, 


V; = QV + Fava + AV e + Am Um 
Então, somando —v, a ambos lados, obtemos 
ajv +: + dii Vi — Vi t aigi Vigi HeH AmnYm = O 


com o coeficiente de v; não sendo nulo. Portanto, os vetores são linearmente dependentes. Reciprocamente, supo- 
nha que os vetores sejam linearmente dependentes, digamos, 


but H bu H bnU = O, com b; #0 
Então podemos resolver em v; e obter 
-1 -1 -1 -1 
v = b; biv; === — b; biit — b; bagt =b R N 


de modo que v, é uma combinação linear dos outros vetores. 
A seguir enunciamos uma afirmação um pouco mais forte do que a que acabamos de provar (Problema 4.33). 
Esse resultado tem muitas consequências importantes. 


Lema 4.10 Suponha que dois ou mais vetores v,, v, ..., v, Sejam linearmente dependentes. Então algum dos veto- 
res é uma combinação linear dos vetores que o antecedem, ou seja, existe algum k > 1 tal que 


V=QU OU CV 
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Dependência linear e matrizes escalonadas 


Considere a seguinte matriz escalonada A, cujos pivôs aparecem circulados. 


7 


a 

Il 
Ssoooo 
socos 
socoBu 
SoowRn 
So Os 


Sou 
SD wa 


Observe que as linhas R,, R}, R, têm zeros na segunda coluna abaixo do pivô não nulo de R, e, portanto, qualquer 
combinação linear de R,, R}, R, necessariamente tem O como segunda entrada. Assim, R, não pode ser uma combi- 
nação linear das linhas abaixo dela. Analogamente, as linhas R, e R, têm zeros na terceira coluna abaixo do pivô 
não nulo de R, e, portanto, R, não pode ser uma combinação linear das linhas abaixo dela. Finalmente, R, não pode 
ser um múltiplo de R,, porque R, tem um O na quinta coluna abaixo do pivô não nulo de R,. Considerando as linhas 
de baixo para cima, R,, R}, R», R,, nenhuma linha é uma combinação linear das linhas que a precedem nessa lista. 
Assim, as linhas são linearmente independentes, pelo Lema 4.10. 

O argumento utilizado com essa matriz escalonada pode ser utilizado para as linhas não nulas de qualquer 
matriz escalonada. Assim, obtemos o seguinte resultado útil. 


Teorema 4.11 As linhas não nulas de uma matriz escalonada são linearmente independentes. 


4.8 BASE E DIMENSÃO 


Inicialmente enunciamos duas maneiras equivalentes de definir uma base de um espaço vetorial V. (A equivalência 
está demonstrada no Problema 4.28.) 


DEFINIÇÃO A Um conjunto S = (u,, u,, ..., u,) de vetores é uma base de V se tiver as duas propriedades seguin- 
tes: (1) S é linearmente independente. (ii) S gera V. 


DEFINIÇÃO B Um conjunto S = (u,, u, ..., u,) de vetores é uma base de V se cada v € V puder ser escrito de 
maneira única como uma combinação linear dos vetores da base. 


O seguinte é um resultado fundamental da Álgebra Linear. 


Teorema 4.12 Seja V um espaço vetorial tal que alguma base tem m elementos e outra base tem n elementos. 
Então m = n. 


Dizemos que um espaço vetorial V tem dimensão finita n ou que é n-dimensional, e escrevemos 
dim V=n 


se V possui alguma base com n elementos. O Teorema 4.12 nos diz que todas as bases de V possuem o mesmo nú- 
mero de elementos, portanto, esse conceito está bem definido. 

O espaço vetorial {0} tem dimensão 0, por definição. 

Suponha que um espaço vetorial V não possua uma base finita. Então dizemos que V tem dimensão infinita. 

O Teorema 4.12 fundamental é uma consequência do “lema de substituição” seguinte (demonstrado no Proble- 
ma 4.35). 


Lema 4.13 Se vv, ...,v,) gera Ve (w, W, ..., W,) é linearmente independente, então m < n, e V é gerado por 
um conjunto da forma 


} 


Assim, em particular, n + 1 ou mais vetores de V são linearmente dependentes. 
Observe, no lema acima, que substituindo m dos vetores do conjunto gerador de V por m vetores linearmente 
independentes continuamos com um conjunto gerador. 


(Wi Wa,- --, Wm Ui Uie’ U 


ln—m 
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Exemplo de bases 


Nesta subseção apresentamos exemplos importantes de bases de alguns dos principais espaços vetoriais deste texto. 


(a) Espaço vetorial K” Considere os n vetores seguintes de K”. 
é1=(1,0,0,0,.00,0,0),.04=10,1,0,0,0:2,0,0), 0005 €, = (0,0,0,0,.0.0,0,1) 


Esses vetores são linearmente independentes. (Por exemplo, constituem uma matriz escalonada.) Além disso, qualquer 
vetor u = (41,42,...,4,)de K” pode ser escrito como uma combinação linear desses vetores. Mais precisamente, 


V = 41€] + 43€ + `` + Apen 


Por isso, esses vetores formam uma base de K”, denominada base canônica de K”. Assim (como 
era de se esperar), K” tem dimensão n. Em particular, qualquer outra base de K” tem n elementos. 


(b) Espaço vetorial M = M, , de todas as matrizes r x s As seis matrizes seguintes constituem uma base do espaço 
vetorial M, 3 de todas as matrizes 2 x 3 sobre K. 


1 0 0 0 1 0 0 0 1I 000 000 000 
0 0 0? JO 0 0/" JO 0 0P |1 0 0? JO 1 0f JO 0 1 


Mais geralmente, no espaço vetorial M = M, , de todas as matrizes r x s, seja E, a matriz com ij-ésima entrada 1 e 


zeros nas demais entradas. Então todas essas matrizes formam uma base de M, ,, denominada base canônica de M, ,. 
Assim, M,, = rs. 


(©) Espaço vetorial P, (t) de todos os polinômios de grau < nO conjunto S = (1,1,2,£,...,t!” den + 1 polinô- 
mios é uma base de P (1). Mais precisamente, qualquer polinômio f(t) de grau < n pode ser escrito como uma combina- 
ção linear dessas potências de t, e podemos mostrar que esses polinômios são linearmente independentes. Assim, dim 
P()=n+1. 

(d) Espaço vetorial P(f) de todos os polinômios Considere qualquer conjunto finito S = (f(1),f(1),.-.,Jm(t)J de 
polinômios de P(t) e seja m o maior dos graus desses polinômios. Então, qualquer polinômio g(t) de grau maior do que 
m não pode ser escrito como uma combinação linear dos elementos de S. Assim, § não pode ser uma base de P(t). Isso 
significa que a dimensão de P(t) é infinita. Observamos que o conjunto infinito S’ = {1, t, Pias .}, consistindo em 
todas as potências de t, gera P(t) e é linearmente independente. Por isso, S’ é uma base infinita de P(t). 


Teoremas sobre bases 


Os três teoremas seguintes (demonstrados nos Problemas 4.37, 4.38 e 4.39) são muito utilizados. 


Teorema 4.14 Se V for um espaço vetorial de dimensão finita n, valem as afirmações seguintes. 


(1) Quaisquer n + 1 ou mais vetores de V são linearmente dependentes. 

Gi) Qualquer conjunto linearmente independente S = {u}, u, ..., U„} com n elementos de V é uma 
base de V. 

Gii) Qualquer conjunto gerador T = (v,, v, ..., v,) de V com n elementos é uma base de V. 


Teorema 4.15 Se Sfor um conjunto gerador de um espaço vetorial V, valem as afirmações seguintes. 


(1) Qualquer subconjunto linearmente independente máximo de S constitui uma base de V. 
(11) Excluindo de S cada vetor que for uma combinação linear dos vetores de S que o precedem, 
os vetores que sobram em S constituem uma base de V. 


Teorema 4.16 Sejam V um espaço vetorial de dimensão finita e S = (u,, u, ..., u,) um conjunto de vetores line- 
armente independentes de V. Então S é parte de uma base de V, ou seja, S pode ser estendido até uma base de V. 
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Exemplo 4.11 


(a) Os quatro vetores de R? seguintes constituem uma matriz escalonada. 
(1,11); (0,1,1,1), (0,0,1,1), (0,0,0,1) 


Assim, os vetores são linearmente independentes e, como Ri = 4, os quatro vetores formam uma base de R4. 


(b) Osn + 1 polinômios de P (t) seguintes são de graus crescentes. 


gd SD, aa 


Portanto, nenhum dos polinômios é uma combinação linear de polinômios que o precedem. Logo, esses poli- 
nômios são linearmente independentes. Além disso, formam uma base de P(t), pois dm P () =n + 1. 


(c) Considere quatro vetores quaisquer de R°, digamos, 
(257, — 132,58), (43,0, —17), (521, —317, 94), (328, —512, —731) 


Pelo Teorema 4.14(i), os quatro vetores necessariamente são linearmente dependentes, por serem elementos 
do espaço vetorial tridimensional R3. 


Dimensão e subespaços 


O teorema seguinte (demonstrado no Problema 4.40) fornece a relação básica entre a dimensão de um espaço ve- 
torial e a dimensão de um subespaço. 


Teorema 4.17 Seja W um subespaço do espaço vetorial V de dimensão n. Então W < n. Em particular, se dim W 
= n, então W = V. 


Exemplo 4.12 Seja W um subespaço do espaço real Rº. Observe que R? = 3. O Teorema 4.17 nos diz que a di- 
mensão de W só pode ser 0, 1,2 ou 3. Vale o seguinte. 


(a) Se dim W = 0, então W = (0), um ponto. 

(b) Se dim W = 1, então W é uma reta pela origem O. 
(c) Se dim W = 2, então W é um plano pela origem O. 
(d) Se dim W = 3, então W é o espaço R° todo. 


4.9 APLICAÇÕES A MATRIZES, POSTO DE UMA MATRIZ 


Seja A uma matriz m x n qualquer sobre um corpo K. Lembre que as linhas de A podem ser vistas como vetores de 
K” e que o espaço linha de A, denotado por lin(A), é o subespaço de K” gerado pelas linhas de A. Temos a seguinte 
definição. 


DEFINIÇÃO O posto de uma matriz A, denotado por pos(A), é igual ao número máximo de linhas linearmente 
independentes de A ou, equivalentemente, igual à dimensão do espaço linha de A. 


Por outro lado, lembre que as colunas de uma matriz m x n qualquer A podem ser vistas como vetores de K” e 
que o espaço coluna de A, denotado por col(A), é o subespaço de K” gerado pelas colunas de A. Embora m possa 
não ser igual a n, ou seja, as linhas e as colunas de A podem pertencer a espaços vetoriais diferentes, temos o resul- 
tado fundamental seguinte. 


Teorema 4.18 O número máximo de linhas linearmente independentes de uma matriz A qualquer é igual ao 
número máximo de colunas linearmente independentes de A. Assim, a dimensão do espaço linha de A é igual à 
dimensão do espaço coluna de A. 


Desta forma, podemos reformular a definição dada de posto de A usando colunas em vez de linha. 
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Problemas de encontrar bases 


Nesta subseção mostramos como uma forma escalonada de uma matriz A qualquer pode nos dar a solução para 
certos problemas sobre a própria matriz A. Mais precisamente, sejam A e B as matrizes seguintes, em que a matriz 
escalonada B (cujos pivôs aparecem circulados) é uma forma escalonada de A. 


12 1 31 2 Q2 1312 
25 5 64 5 Ma doi 
4A=|37 6116 9 e B=l000D112 
15 10 89 9 000000 
2 6 8 11 9 12 000000 


Os quatro problemas a resolver, relativos à matriz A de colunas C,, C,, ..., C,, são os seguintes. 


(a) Encontrar uma base do espaço linha de 4. 

(b) Encontrar cada coluna de A que seja uma combinação linear das colunas de A que a antecedem. 
(c) Encontrar uma base do espaço coluna de 4. 

(d) Encontrar o posto de A. 


(a) É dado que A e B são equivalentes por linhas, portanto, têm o mesmo espaço linha. Além disso, B está em forma 
escalonada, portanto, suas linhas não nulas são linearmente independentes e, por isso, formam uma base do espaço 
linha de B. Assim, elas também formam uma base do espaço linha de A. Segue que 


base de lin(4):  (1,2,1,3,1,2),  (0,1,3,1,2,1), (0,0,0,1, 1,2) 


(b) Seja M, = [C,, C, ..., C,] a submatriz de A que consiste nas primeiras k colunas de A. Então M, ,e M, são, respec- 
tivamente, a matriz de coeficientes e a matriz aumentada da equação vetorial 


xC +56, eres +X Cl = C, 


O Teorema 3.9 nos diz que o sistema tem uma solução ou, equivalentemente, que C, é uma combinação linear das colu- 
nas precedentes de A se, e só se, pos(M,) = pos(M, |), onde pos(M,) significa o número de pivôs na forma escalonada 
de M,. Agora, as primeiras k colunas da matriz escalonada B também constituem uma forma escalonada de M,. Por isso, 


pos(M,) = pos(M,) = 2 e pos(M ) = pos(M,) = pos(M,) = 3 


Assim, as linhas C,, C, e C; são, cada uma, combinação linear das colunas de A que as antecedem. 


(c) O fato de que as colunas C,, C, e C, não são combinações lineares das colunas que as precedem também nos mostra 
que são linearmente independentes. Assim, elas formam uma base do espaço coluna de A. Segue que 


base de col(A): [1,2,3,1,2]],  [2,5,7,5,6],  [B,6,11,8,11]” 
Observe que C,, C, e C, também podem ser caracterizadas como aquelas colunas de A que contêm os pivôs de qualquer 
forma escalonada de A. 


(d) Observamos, aqui, que três possíveis definições do posto de A fornecem o mesmo valor. 


(1) Existem três pivôs em B, que é uma forma escalonada de 4. 
Gi) Os três pivôs de B correspondem às linhas não nulas de B, que formam uma base do espaço linha de A. 
Gii) Os três pivôs de B correspondem às colunas de A, que formam uma base do espaço coluna de A. 


Assim, pos(A) = 3. 
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Aplicação para encontrar uma base de W = ger(u,, u,, ...; U,) 


Frequentemente, nos é dada uma lista S = (w,, u,, ..., u,) de vetores de K” e queremos encontrar uma base do su- 
bespaço W de K” gerado pelos vetores dados, ou seja, uma base de 


W = ger(S) = ger(u,, u,,...,u,) 


Os dois algoritmos seguintes, essencialmente descritos na subseção precedente, encontram uma tal base (e, portan- 
to, a dimensão) de W. 


Algoritmo 4.1 (Algoritmo do espaço linha) 


Passo 1 Construa a matriz M cujas linhas sejam os vetores dados. 
Passo 2 Reduza M à forma escalonada. 
Passo 3 A resposta são as linhas não nulas da matriz escalonada. 


As vezes queremos encontrar uma base que utiliza apenas os vetores dados originalmente. O próximo algorit- 
mo realiza esta tarefa. 


Algoritmo 4.2 (Algoritmo de eliminação) 


Passo 1 Construa a matriz M cujas colunas sejam os vetores dados. 

Passo 2 Reduza M à forma escalonada. 

Passo 3 Para cada coluna C, da matriz escalonada que não tenha pivô, elimine o vetor u, da lista S dada. 
Passo 4 A resposta são os vetores não eliminados de S (que correspondem às colunas com pivôs). 


Enfatizamos que, no primeiro algoritmo, formamos uma matriz cujas linhas são os vetores dados, enquanto no 
segundo algoritmo formamos uma matriz cujas colunas são os vetores dados. 


Exemplo 4.13 Seja W o subespaço de R? gerado pelos vetores seguintes. 
uy = (1,2,1,3,2), us = (1,3,3,5,3), us = (3,8,7,13,8) 
u, = (1,4,6,9,7), us = (5,13,13,25,19) 


Encontre uma base de W dentre os vetores dados e encontre dim W. 
Construímos a matriz M cujas colunas são os vetores dados e encontramos sua forma escalonada. 


1 1 31 5 113 15 
2 3 8 4 13 01223 
M=|13 76 13|-/0 00 1 2 
35 B 9 25 00000 
2 3 8 7 19 00000 


Os pivôs da matriz escalonada aparecem nas colunas C}, C,, C,. Por isso, eliminamos os vetores u, e us dos cinco 
vetores originais. Os vetores restantes, u,, u,, U4, que correspondem às colunas com pivôs da matriz escalonada, 
formam uma base de W. Assim, em particular, dim W = 3. 


OBSERVAÇÃO A justificativa do algoritmo de eliminação dado já foi essencialmente descrita, mas a repetimos 
aqui para enfatizá-la. A coluna C, da matriz escalonada do Exemplo 4.13 não ter um pivô significa que a equação 
vetorial 


Xu; + yu, = Us 


tem uma solução e, portanto, u, é uma combinação linear de u, e u,. Analogamente, a coluna C; não ter um pivô 
significa que u, é uma combinação linear dos vetores que o antecedem. Eliminamos cada vetor do conjunto gerador 
original que seja uma combinação linear dos vetores que o antecedem. Assim, os vetores que não são eliminados 
formam uma base de W. 
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Aplicação a sistemas de equações lineares homogêneos 


Considere, novamente, um sistema AX = 0 de equações lineares homogêneo sobre K com n incógnitas. Pelo Teo- 
rema 4.4, o conjunto solução W de um tal sistema é um subespaço de K” e, portanto, W tem alguma dimensão. Te- 
mos o teorema seguinte, cuja demonstração será adiada até o Capítulo 5. 


Teorema 4.19 A dimensão do espaço solução W de um sistema homogêneo AX = 0 én — r, onde n é o número 
de incógnitas e r é o posto da matriz de coeficientes A. 


No caso em que o sistema AX = 0 está em forma escalonada, ele tem exatamente n — r variáveis livres, diga- 
mos, Xi Xi, ++ +o Xi, Seja v, a solução obtida tomando Xi, = 1 (ou qualquer outra constante não nula) e as demais 
variáveis livres iguais a 0. Mostramos (Problema 4.50) que as soluções v, v, ..., v, , São linearmente independen- 
tes, portanto, formam uma base do espaço solução W. 

Na Seção 3.11, já utilizamos esse processo para encontrar uma base do espaço solução W de um sistema ho- 
mogêneo AX = 0. O Problema 4.50 dá outros três exemplos. 


4.10 SOMAS E SOMAS DIRETAS 


Sejam U e W dois subconjuntos de um espaço vetorial V. A soma de U e W, denotada por U + W, consiste em todas 
as somas u + w,comu EU e we W. Isto é, 


U+W={v:v=u+w,comuEU eweW) 


Suponha, agora, que U e W sejam subespaços de V. Então podemos mostrar, facilmente (Problema 4.53) que 
U + W é um subespaço de V. Lembre que U N W também é um subespaço de V. O teorema seguinte (demonstrado 
no Problema 4.58) relaciona as dimensões desses subespaços. 


Teorema 4.20 Sejam U e Wsubespaços de dimensão finita de um espaço vetorial V. Então U + W tem dimensão 
finita e 


dim(U + W) = dim U + dim W — dim(U N W) 


Exemplo 4.14 Seja V = M, , o espaço vetorial das matrizes 2 x 2. Seja U o conjunto das matrizes cuja segunda 
linha é nula e seja W o conjunto das matrizes cuja segunda coluna é nula. Então 


o p ED e verle 8) vorte 2) 


Logo, U + W consiste naquelas matrizes cuja entrada inferior direita é zero e U N W consiste naquelas matrizes 
cuja segunda linha e coluna são nulas. Observe que dim U = 2, dim W = 2, dim (U N W) = 1. Também dim(U + 
W) = 3, o que era de se esperar pelo Teorema 4.20. Portanto, 


dim(U + W) = dim U + dim W — dim(U N W) =2 +2-1=3 
Somas diretas 
Dizemos que um espaço vetorial V é a soma direta de seus subespaços U e W, e escrevemos 
V=UƏW 


se cada v € V puder ser escrito, de modo único, como v = u + w, comu EU e weW, 
O teorema seguinte (demonstrado no Problema 4.59), caracteriza uma tal decomposição. 


Teorema 4.21 O espaço vetorial V é a soma direta de seus subespaços U e W se, e só se, (i) V = U + W, 
GDU NW = {0}. 
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Exemplo 4.15 Considere o espaço vetorial V = RÌ. 
(a) Sejam U o plano xy e Wo plano yz, ou seja, 
U = {(a,b,0) :a,b E R} e W = {(0,b,c): b,c € R} 


Então R? = U + W, pois cada vetor de R? é a soma de um vetor de U e um vetor de W. Contudo, R? não é a 
soma direta de U e W, porque tais somas não são únicas. Por exemplo, 


(3,5, 7) = (3,1,0) + (0,4,7) e, também, (3,5, 7) = (3, —4, 0) + (0, 9, 7) 
(b) Sejam U o plano xy e Wo eixo z, ou seja, 
U = {(a,b,0) :a,b E R} e W = {(0,0,c):c E R} 


3 . Ed 
Agora, cada vetor (a, b, c) € R? pode ser escrito como a soma de um vetor de U e um vetor de W de uma única 
maneira, como segue. 


(a, b, c) = (a, b, 0) + (0, 0, c) 
Por isso, R? é a soma direta de U e W, ou seja, R =UV. 


Somas diretas gerais 


A noção de soma direta pode ser estendida a mais fatores da maneira óbvia. Isto é, V é a soma direta dos subespa- 
ços W,, W3, ..., W, e escrevemos 


se cada vetor v € V puder ser escrito, de modo único, como 
v= w +w + +w, 


com w; E Wi, w E Wn, ..., W, E W, 
Temos os teoremas seguintes. 


Teorema 4.22 Suponha que V = W, ® W, © --- © W, e que, para cada k, S, seja um subconjunto linearmente 
independente de W,. Então valem as afirmações seguintes. 


(a) A união S = |J, S, é linearmente independente em V. 
(b) Se cada S, é uma base de W,, então U: Sy é uma base de V. 
(c) dim V = dim W, + dim W, + --- + dim W.. 


Teorema 4.23 Suponha que V = W; +W,+-::-+ W,e que dim V = 57, dim W,. Então 
V= W 9m- em. 


4.11 COORDENADAS 


Seja V um espaço vetorial n-dimensional sobre K com base S = (u,, t, ..., u,). Então qualquer vetor v € V pode 
ser escrito, de modo único, como uma combinação linear dos vetores da base S, digamos, 


v=au, tau +---+au, 


Dizemos que os n escalares a,, a, ..., a, são as coordenadas de v em relação à base S; essas coordenadas formam 
um vetor [a,, a, ..., 4,] de K” denominado vetor de coordenadas de v em relação à base S. Esse vetor é denotado por 
[v]; ou, simplesmente, [v], quando S estiver subentendido. Assim, 


[v]; = la,, a, ...,a,] 


Por uma questão de notação, usamos colchetes [. . .] em vez de parênteses (. . .) para denotar o vetor de coorde- 
nadas. 
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OBSERVAÇÃO Os n escalares a, a, ..., a, também formam o vetor coluna de coordenadas 


n 


r x . 
[a,, à,, ...,a,] de v em relação a S. A escolha do vetor coluna em vez do vetor linha para representar as coor- 
denadas de v depende do contexto em que for usado. O uso desses vetores coluna ficará claro no Capítulo 6. 


Exemplo 4.16 Considere o espaço vetorial P,(t) dos polinômios de grau <2. Os polinômios 
pet+l, p=t-1, m=(t-1?=2-2+41 


formam uma base S de P,(t). O vetor de coordenadas [v] de v = 2º — 5t + 9em relação a S é obtido como segue. 
Escrevemos v = xp, + yp, + zp, com incógnitas escalares e simplificamos. 


2º — 5t +9 =x(t+1)+y(t—1)+z(č —2t+1) 
=xt+x+yt—y+zť —2zt+z 
=z + (x+y -—2z)t+(x—-y+z) 


Em seguida, igualamos os coeficientes de mesmas potências de t para obter o sistema 
2=2, x+Hy—2z=—S5, x—y+z=9 

A solução desse sistema é x = 3, y = —4, z = 2. Assim, 
v = 3p, — 4p, + 2p, e, portanto, [v] = [3, —4, 2]. 

Exemplo 4.17 Considere o espaço real Rê. Os vetores seguintes formam uma base de R°. 
u = (1,-1,0), u, = (1,1,0), us = (0,1,1) 


As coordenadas de v = (5, 3, 4) em relação à base S são obtidas como segue. 
Escrevemos v = xu, + yu, + zus, OU seja, escrevemos v como uma combinação linear dos vetores da base 
usando incógnitas escalares x, y, z. Isso fornece 


5 1 1 0 
3)=x|-1 | +y]1|+2]1 
4 0 0 1 


O sistema de equações lineares equivalente é o seguinte. 
x iy=3. —x+y+z=3, z=4 


A solução do sistema é x = 3, y = 2, z = 4. Assim, 
v = 3u, + 2u, + 4u, e, portanto, [v]; = [3, 2, 4]. 


OBSERVAÇÃO 1 Existe uma interpretação geométrica para as coordenadas de um vetor v em relação a uma base 
S para o espaço real R”, que ilustramos usando a base S de R? do Exemplo 4.17. Inicialmente, considere o espaço 
R? com os eixos x, y, z usuais. Então os vetores da base § determinam um novo sistema de coordenadas de R? com 
eixos, digamos, x”, )”, 7, conforme Figura 4-4, que tem as propriedades seguintes. 


(1) O eixo x’ tem a direção e o sentido de u, com unidade medindo |Ju |||. 
. I . o E . . 

(2) O eixo Y tem a direção e o sentido de u, com unidade medindo ||u, ||. 

(3) O eixo 7’ tem a direção e o sentido de u, com unidade medindo |ju.]. 


Então cada vetor v = (a, b, c) ou, equivalentemente, o ponto P(a, b, c) de Rº tem novas coordenadas em relação aos 
novos eixos x”, y’, Z. Essas novas coordenadas são precisamente [v],, as coordenadas de v em relação à base S. 
Assim, conforme mostramos no Exemplo 4.177, as coordenadas do ponto P(5,3,4) em relação aos novos eixos for- 
mam o vetor [3, 2, 4]. 


OBSERVAÇÃO 2 Considere a base canônica E = (e,, €,,...,e,) de K” definida por 


e =(1,0,0,...,0,0),  &=(0,1,0,...,0,0), ..., e,=(0,0,0,...,0,1) 


G  Árcesra Linear 


v = (5, 3, 4) = [3, 2, 4] 


Figura 4-4 


Seja v = (a,, a, ..., 4„) um vetor qualquer de K”. Então é fácil mostrar que 


v=ae+ae +: F apen, e, portanto, [v] = [ai å ...,4,] 


54, 


z 


Assim, o vetor de coordenadas [v], de qualquer vetor v em relação à base canônica E de K” é idêntico ao vetor v 
original. 


Isomorfismo de Ve K” 


Sejam V um espaço vetorial de dimensão n sobre K e S = (u,, u,, ..., u,) uma base de V. Então, a cada vetor v € V 
corresponde uma única ênupla [v]; de K”. Por outro lado, a cada ênupla [c,, c,, ..., c,] de K” corresponde um único 
vetor CU] + cou, + ++ + cu, de V. Assim, a base S induz uma aplicação bijetora entre Ve K”. Além disso, sejam 
dados 


v=au tau: F apun e w = byu; + byu +++- + bpn 


Então 
v+w= (a + biju + (a, + bo)u, Spina (a, +bu, 
kv = (kay)uy + (kaz)uz +-+- + (ka, Ju, 
onde k é um escalar. Dessa forma, 
[v + w]s = [a + bi, o ant bp] = [ar,a] + [bis ba] = [os + [wls 
[kv]; = [ka , kaz, ...,ka„] = klai, a, ...,a„] = k[ol]s 
Assim, essa aplicação bijetora entre V e K” preserva as operações de soma de vetores e multiplicação por escalar 
dos espaços vetoriais. Nesse caso, dizemos que V e K” são isomorfos, e escrevemos 
V S K” 


Enunciamos esse resultado formalmente como segue. 
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Teorema 4.24 Seja V um espaço vetorial n-dimensional sobre um corpo K. Então V e K” são isomorfos. 


O próximo exemplo fornece uma aplicação prática desse teorema. 


Exemplo 4.18 Suponha que queiramos determinar se as matrizes seguintes de V = M, ; são ou não são linear- 
mente dependentes. 


1 2 -3 1 3 —4 3 8 —Il 
a=; 0 E s=; 5 i cal 10 3] 
Os vetores de coordenadas das matrizes na base canônica de M, 3 são 
[4] = [1,2,-3,4,0,1], [B] = [1,3,-4,6,5,4], [C] = [3,8,—11, 16, 10,9] 
Formamos a matriz M cujas linhas são os vetores de coordenadas obtidos e reduzimos M à forma escalonada. 
1 2 -3 4 0 1 1 2 -3 4 0 1 1 2 -3 4 0 1 
M=|1 3 -4 6 5 4|j~]|O 1 12/53/0101 -1 2 5 3 
3 8 —ll 16 10 9 0 2 -2 4 10 6 0 0 0000 


Como a matriz escalonada possui apenas duas linhas não nulas, os vetores de coordenadas [A], [B], [C] geram um 
subespaço bidimensional, portanto, são linearmente dependentes. Por isso, as matrizes A, B, C originais são line- 
armente dependentes. 


Problemas Resolvidos 


Espaços vetoriais, combinações lineares 


4.1 Sejam u e v dois vetores de um espaço vetorial V. Simplifique cada uma das expressões seguintes. 


(a) E; =3(2u — 4v) + 5u+7v, (c) E; = 2uv + 3(2u + 4v) 
3 

(b) E, = 3u -— 6(3u — 5v)+ 7u, (d) E = 5u-—-= + 5u 
v 


Multiplicamos e agrupamos os termos. 
(a) E; = 6u — 12v + 5u + 7v = 1lu — 5v 
(b) E, = 3u — 18u + 30v + 7u = —8u + 30v 


(c) E, não está definido porque não definimos o produto de dois vetores. 


(d) E, não está definido porque não definimos a divisão por um vetor. 


4.2 Demonstre o Teorema 4.1. Seja V um espaço vetorial sobre um corpo K. 
(1) r0 = 0. (ii) Ou = 0. (iii) Se ru = 0, então r = 0 ou u = Q. (iv) (nu = r(=u) = —ru. 
G) Pelo Axioma [A,], com u = 0, temos O + 0 = 0. Logo, pelo Axioma [M,], temos 


r0 = r(0 + 0) = 70 + r0 
Somando -70 a ambos lados, obtemos o resultado esperado. 
(ii) Para escalares, O + O = 0. Logo, pelo Axioma [M,], temos 
Ou = (0 + O)u = Ou + Ou 
Somando —Ou a ambos lados, obtemos o resultado esperado. 


Gii) Supondo que ru = 0 e r # 0, podemos tomar o escalar r` tal que r'r = 1. Assim, 


u= lu = (r'u =r (ru =r'0=0 


(iv) Usando u + (-u) = 0 e r + (-r) = 0, obtemos 


0 = 70 = r[u + (-u)] = ru + r(-u) e 0 = Ou = [r + (-r)]u = ru + (-r)u 
Somando —ru a ambos lados da primeira equação, obtemos —ru = r(—u) e, somando —ru a ambos lados da segunda 
equação, obtemos —ru = (-r)u. Assim, (—r)u = r(=u) = =ru. 


G ÁLGEBRA LINEAR 


4.3 


4.4 


4.5 


4.6 


Mostre que (a) r(u — v) = ru — rv, (b) u + u = 2u) 


(a) Usando a definição de subtração, a saber, que u — v = u + (-v), e o Teorema 4.1(iv), a saber, que r(—v) = —rv, 
obtemos 


r(u — v) = r[ļu + ({v)] = ru + r(—{v) = ru + (—rv) = ru — rv 


(b) Usando primeiro o Axioma [M,] e, depois, o Axioma [M,], resulta 


u + u= lu+ lu = (1 + l)u = 2u 


Escreva v = (1,-2,5) de R? como uma combinação linear dos vetores 


u = (1, 1, 1), u = (1, 2, 3), u, = (2, -1, 1) 


Queremos encontrar escalares x, y z, ainda incógnitos, tais que v = xu, + yu, + zu,. Ou seja, exigimos 


1 1 x+ y+2z= 1 
—2 | =x| 1| +y|2| +z|-—1 ou x+2y— z= -2 
5 1 3 x+3y+ z= 5 


(Por conveniência, escrevemos os vetores de R? como colunas, porque dessa forma é mais fácil encontrar o sistema de 
equações lineares equivalente.) Reduzindo o sistema à forma escalonada, obtemos o sistema triangular 


x+y+2z=1, y— 3z = —3, 5z = 10 


O sistema é consistente e tem uma solução. Substituindo para trás, obtemos a solução x = —6, y = 3, z = 2. Assim, v = 
—6u, + 3u, + 2u. 

Alternativamente, escrevemos a matriz aumentada M do sistema de equações lineares equivalente, em que 1, u,, U, são 
as três primeiras colunas de M e v é a última coluna, e reduzimos M à forma escalonada, como segue. 


la 1 1 1 2 1 1 1 2 1 
M=|12 1 =2|=1]0 1-3 =3| 0 I =3,=3 
3 1 5 02 -=l 4 0 0 5 10 


A última matriz corresponde a um sistema triangular, que tem solução. Substituindo o sistema triangular para trás, ob- 
temos a solução x = —6, y = 3, z = 2. Assim, v = —6u, + 3u, + 2u,. 


Escreva v = (2, —5, 3) de R? como uma combinação linear dos vetores 


u, = (1, -3, 2), u, = (2, 4, -1), u, = (1, -5, 7) 


Queremos encontrar escalares x, y z, ainda incógnitos, tais que v = xu, + yu, + zu,. Ou seja, exigimos 


2 1 2 1 x+2y+ z= 2 
=5 | =x| -3 | +y | —4 | +z| —5 ou 3x — 4y — 5z = —5 
3 2 —1 7 2x— y+7z= 3 


Reduzindo o sistema à forma escalonada, obtemos o sistema 
x+2y+z2=2, 2y-—-2z2=1, 0=3 
O sistema é inconsistente e não tem solução. Assim, v não pode ser escrito como uma combinação linear de u,, u,, Uz. 
Escreva o polinômio v = É + 4t — 3 de P(t) como uma combinação linear dos polinômios 
pi =f -—2t+85, p=22-3, p=t+1 


Consideremos v como uma combinação linear de p,, p,, p, usando incógnitas x, y, z para escrever 
1 2 3 


Pr+4-3=xP-U+5S)+y(22 3t) +2(t+1) œ) 


Podemos continuar de duas maneiras. 
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Método 1 Expandimos o lado direito de (*) em termos das potências de t como segue. 


Ë +4t -3 = xt — 2xt + 5x + 2yÊ — 3yt + zt +z 


= (x + 2y) + (—2x — 3y + z)t + (5x + 32) 


Igualando os coeficientes de mesma potência de t e reduzindo o sistema à forma escalonada, obtemos 


x+2y= 1 x+2y= 1 x+2y= 1 
—2x—3y+ z= 4 ou y+ z= 6 ou y+ z= 6 
5x + 3z = —3 —10y + 3z = —8 13z = 52 


O sistema é consistente e tem uma solução. Substituindo para trás, obtemos a solução x = —3, y = 2, z = 4. Assim, v = 
-3p, + 2p, + 4p. 

Método 2 A equação (*) é uma identidade em ż, ou seja, a igualdade vale para cada valor de t. Assim, podemos tomar 
t igual a quaisquer números para obter equações nas incógnitas, como segue. 

(a) Tomando t = 0 em (*), obtemos a equação -3 = 5x + z 

(b) Tomando t = 1 em (*), obtemos a equação 2 = 4x — y + 2z 

(c) Tomando t = —1 em (*), obtemos a equação —6 = 8x + 5y 


Resolvemos o sistema das três equações para obter, de novo, a solução x = —3,y = 2, z = 4. Assim, v = -3p, + 2p, + 
4p,. 


4.7 Escreva M como uma combinação linear das matrizes A, B, C seguintes. 
4 7 1 1 1 2 1 4d 
M = e As B= CS 
EM hab sap esfas] 
Consideremos M como uma combinação linear de A, B, C usando incógnitas escalares x, y, z, ou seja, considera- 
mos M = xA + yB + zC. Obtemos 
4 7|_ |1 1 l 2 1 1| _ | x+y+z o x+2y+2z 
Ê | =al] il +l A +z; J = |: H3y+ 42 x+4y+5z 
Igualando entradas correspondentes, formamos o sistema de equações equivalente 
x+y+z=4, x+2y+z=7, x+3y+4z=7, x+4y+5z=9 
Reduzindo o sistema à forma escalonada, obtemos 
x+y+z=4, y=3,; 3z = —3, 4z = —4 
A última equação é redundante e, portanto, eliminada. Substituindo para trás, obtemos a solução z = —1, y = 3, x = 2. 
Assim, M = 2A + 3B —C. 
Subespaços 
4.8 Demonstre o Teorema 4.2. W é um subespaço de V se as duas condições seguintes são verdadeiras. 
(a) 0ER. 
(b) Seuve Were K,entãou+v, rue W. 
Por (a), W é não vazio e, por (b), as operações de adição vetorial e multiplicação de vetor por escalar estão bem defini- 
das em W. Os Axiomas [A], [A,], [M,], [M,], [Ms], IM,] valem em W porque os vetores de W pertencem a V. Assim, 
resta mostrar que [A,] e [A,] valem em W. Entretanto, [A,] vale porque o vetor nulo de V pertence a W, por (a). Final- 
mente, se v e W, então (—1)v = —v € W, e v+ (—v) = 0.Assim, vale [A,] em W. 
4.9 Seja V = Rº. Mostre que W não é um subespaço, nos casos seguintes. 


(a) W= {(a,b,c):a > 0}, (b) W = {(a,b,c) :@@ + +e <1}. 


Em cada caso, mostre que não vale o Teorema 4.2. 


G] ÁLGEBRA LINEAR 


4.10 


4.11 


4.12 


(a) W consiste naqueles vetores com primeira entrada não negativa. Assim, v = (1, 2, 3) pertence a W. Seja r = —3. 
Então rv = (— 3, —6, —9) não pertence a W, porque —3 é negativo. Assim, W não é um subespaço de V. 
(b) W consiste naqueles vetores cujo comprimento não é maior do que 1. Assim, u = (1, 0, 0) e v = (0, 1, 0) pertencem 


a W, mas u + v = (1, 1,0) não pertence a W, porque 12 + 1? +0? = 2 > 1.Assim, W não é um subespaço de V. 


Seja V = P(t) o espaço vetorial dos polinômios reais. Decida se W é, ou não é, um subespaço de V, nos casos 
seguintes. 

(a) W consiste em todos os polinômios de coeficientes inteiros. 

(b) W consiste em todos os polinômios de grau > 6 e o polinômio zero. 

(c) W consiste em todos os polinômios com somente potências pares de t. 


(a) Não é, porque a multiplicação por escalar de polinômios de Wnem sempre pertence a W. Por exemplo, 
f)=3+6+7PeW mas i()=i+3+1?gW 


(b e c) Sim. Em cada caso, W contém o polinômio nulo e as somas e múltiplos escalares de polinômios de 
W estão em W. 


Seja V o espaço vetorial das funções f : R — R. Mostre que W é um subespaço de V, nos casos seguintes. 
(a) W = (f(x) : f(1) = 0}, todas as funções cujo valor em 1 é 0. 
(b) W = {f (x) :f(3) =f (1)}, todas as funções com mesmo valor em 3 e 1. 
(c) W = {f (t) :f(—x) = —f (x) }, todas as funções ímpares. 
Denotemos por Ô a função nula, isto é, Ô(x) = 0, para cada valor de x. 
(a) de, porque ô) = 0. Sejam f,g € W. Então (1) = 0 e g(1) = 0 e, dados escalares a e b, temos 
(af + bg)(1) = af (1) + bg(1) = a0 + b0 = 0 
Assim, af + bg € W e, portanto, W é um subespaço de V. 
(b) Ô € W, porque 0(3) = 0 = Ô(1). Sejam f, g € W. Então f3) = f1) e g(3) = g(1) e, dados escalares a e b, temos 


(af + bg)(3) = af (3) + bg(3) = af (1) + bg(1) = (af + bg)(1) 


Assim, af + bg € W e, portanto, W é um subespaço de V. 
(c) Ô e W, porque Ô(-x) = 0 = —0 = —Ô(x). Sejam fg € W. Então f(x) = fx) e gx) = -g(x) e, dados 
escalares a e b, temos 


(af + bg)(=x) = af (~x) + bg(-x) = —af(x) — bg(x) = —(af + bg) (x) 


Assim, ab + gf € W e, portanto, W é um subespaço de V. 


Demonstre o Teorema 4.3. A interseção de um número qualquer de subespaços de V é um subespaço de V. 


Seja { W; : i € 1) uma coleção de subespaços de V e denotemos W = N(W;, : i € I) Como cada W, é um subespaço de 
V, temos O € W, para cada i € I. Portanto, 0 € W. Se u, v € W, então u, v € W;, para cada i € I. Como cada W, é um 
subespaço, temos au + bv € W, para cada i € I. Portanto, au + bv € W. Assim, W é um subespaço de V. 


Espaços gerados 


4.13 


Mostre que os vetores u, = (1, 1, 1), u, = (1, 2, 3), u, = (1, 5, 8) geram R?. 


Devemos mostrar que qualquer vetor v = (a, b, c) de R? é uma combinação linear de U,, Us, Us. Escrevemos v = xu, + 
yu, + zu,, OU seja, 


(a,b,c) =x(1,1,1) +y(1,2,3) +z(1,5,8) = (x+y +z, x+2y+5z, x+ 3y + 8z) 


4.14 


4.15 


4.16 
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Formamos o sistema equivalente e reduzimos à forma escalonada. 


x y z=a x+y+ z=a x+y+ z=a 
x+2y+52=b ou y+4=b-a ou y+4=b-a 
x+3y+82=c 2y+Tc=c-a -z=c-2b+a 


Esse sistema está em forma escalonada e é consistente; de fato, 


x= —a + 5b — 3c, y=3a-7b+4c, z=a+2b-c 


é uma solução. Assim, u,, u,, U} geram R'. 


Encontre condições sobre a, b, c tais que v = (a, b, c) de Rº pertença a W = ger(u,, u,, u,), sendo 


u, = (1, 2, 0), u, = (-1,1,2),u; = (3,0, -4) 


Escrevemos v como combinação linear de u,, u,, u, usando incógnitas escalares x, y, z, ou seja, escrevemos v = xu, + 
yu, + zu,. Isso fornece 


(a,b,c) = x(1,2,0) + y(—1, 1,2) +z(3,0,—4) =(x-y+32, 2x+y, 2y- 4z) 


Formamos o sistema de equações equivalente e reduzimos à forma escalonada, como segue. 


x—y+3z=a x—y+32z=a x—-y+32z=a 
2x +y =b ou 3y — 6z = b — 2a ou 3y — 6z = b — 2a 
2y—4z=c¢ 2y—4z=c¢ 0 = 4a — 2b + 3c 


O vetor v = (a, b, c) pertence a W se, e só se, o sistema é consistente e esse sistema é consistente se, e só se, 4a — 2b + 
3c = 0. Em particular, observe que u,, u,, U, não geram todo o espaço RÈ. 


Mostre que o espaço vetorial V = P(t) dos polinômios reais não pode ser gerado por um número finito de 
polinômios. 

Qualquer conjunto finito $ de polinômios contém um polinômio de grau máximo, digamos, m. Então o espaço gerado 
por S não pode conter qualquer polinômio de grau maior do que m. Assim, ger (S) # V para qualquer conjunto finito S. 


Demonstre o Teorema 4.5. Seja S um subconjunto de V. (1) Então ger(S) é um subespaço de V que contém 
S. (ii) Se W é um subespaço de V que contém S, então ger (S) C W. 


G) Supondo que S seja vazio, temos ger(S) = (0), por definição e, portanto, ger(S) = {0} é um subespaço de Ve S C. 
Supondo que S seja não vazio, tomamos v € S. Então v = lv €e, portanto, S C ger (S). Também 0 = 0v € ger (S). 
Agora, dados u, w € ger (S), digamos, 


u = aju; +++: + a,u, => au; e w= biwi +: + bws = X byw; 
i TO 


comu; w ES e a; b;€ K, resulta que 


u+ v= J am; +) bw; e au=a p am) = J aag 
7 j i 


1 


pertencem a ger(S), porque cada um é uma combinação linear de vetores de S. Assim, ger(S) é um subespaço de V. 


Gi) Dados u,,u,5,...,4, E S, cada u; pertence a We, portanto, todos múltiplos a,u,, a,u,,...,a,u, E W e, então, 
também a soma au, + azu +: + a,u, E W. Assim, W contém todas combinações lineares de elementos de S, 
ou seja, ger (S) C W, conforme afirmação. 


Dependência linear 


4.17 


Decida se u e v são linearmente dependentes, ou não, nos casos seguintes. 


(a) u= (1,2), v= (3-5); (c) u= (1,2,=3), U= (4,5,—6) 
O u=(,-3,0=(-2,6), (Du=(2,4,-8),0=(3,6,-12) 


Dois vetores u e v são linearmente dependentes se, e só se, um deles é um múltiplo do outro. 


GJ  Árcesra Linear 


4.18 


4.19 


4.20 


4.21 


(a) Não são. (b) São, pois v = —2u. (c) Não são. (d) São, pois v = žu. 


Decida se u e v são linearmente dependentes ou não nos casos seguintes. 
(a) u=22+4-3,v=42481-—6, (b) u=22-3+4,v=42-H+2, 


o u=[13 5-4 -I2 16 a u=11M,-[222 
o o -1pP”3|-2 0 4p “= |2 2 2P”3|3 3 3 
Dois vetores u e v são linearmente dependentes se, e só se, um deles é um múltiplo do outro. 

(a) São, pois v = 2u. (b) Não são. (c) Sim, pois v = —4u. (d) Não são. 


Decida se os vetores u = (1, 1, 2), v = (2, 3, 1), w = (4, 5, 5) de R? são linearmente dependentes ou não. 


Método 1 Igualamos a zero uma combinação linear de u, v, w usando incógnitas x, y, z para obter o sistema de equa- 
ções lineares equivalente, que reduzimos à forma escalonada, como segue. 


1 2 4 0 x+2y+4z=0 o 
x| l| +y|3|+z|5|=]10 ou x+3y+5z=0 ou D pE 
1 1 5 0 2x+ y+52=0 Le da 


O sistema escalonado só tem duas equações com três incógnitas, de modo que tem uma variável livre e uma solução não 
nula. Assim, u, v, w são linearmente dependentes. 


Método 2 Formamos a matriz A de colunas u, v, w e reduzimos à forma escalonada. 


12 4 1 2 4 1 2 4 
A=|1 3 5j~]O 1 lj~ JO 1 1 
2 1 5 0 =3 =3 00 0 


A terceira coluna não tem um pivô, portanto, o terceiro vetor é uma combinação linear dos dois primeiros vetores u e v. 
Assim, os vetores são linearmente dependentes. (Observe que a matriz A também é a matriz de coeficientes do sistema 
do Método 1. Em outras palavras, esse método é essencialmente igual ao primeiro.) 


Método 3 Formamos a matriz B de linhas u, v, w e reduzimos à forma escalonada. 


112 01 2 1 1 2 
B=-|231/-/0 1 -3]-10 1 -3 
4 5 5 0 1 =3 0 0 0 


Como a matriz escalonada só tem duas linhas não nulas, os três vetores são linearmente dependentes. (Os três vetores 
dados geram um espaço bidimensional.) 


Decida se os vetores de R? dados são linearmente dependentes ou não nos casos seguintes. 
(a) ui == (152, 5), us = (1, 3; Li; us = (2, 5; 7), ug = (3; 1,4), 


6) u=(1;25) 0= (25 w= (1,5,2), 
(o) u= (1,2,3), v = (0,0,0), w = (1,5,6). 
(a) São, pois quaisquer quatro vetores de R? são linearmente dependentes. 


(b) Usando o Método 2 do problema precedente, formamos a matriz A de colunas u, v, w e reduzimos à forma 


escalonada. 
1 2 1 1 2 1 12 1 
A=|2 5 5|-I0 1 3/10 1 3 
Sl, 2 0 —-9 -3 0 0 24 


Cada coluna tem uma entrada pivô, portanto, nenhum vetor é uma combinação linear dos vetores que o antecedem. 
Assim, os vetores são linearmente independentes. 


(c) Como 0 = (0, 0, 0) é um dos vetores, os vetores são linearmente dependentes. 


Mostre que as funções f(t) = sen t, g(t) = cos t, h(t) = t de R em R são linearmente independentes. 
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Igualamos à função zero 0 uma combinação linear de f, g, h usando incógnitas escalares x, y, z, ou seja, tomamos xf + 
yg + zh = 0 e mostramos que x = 0, y = 0, z = 0. Enfatizamos que xf + yg + zh = 0 significa que, para cada valor de 
t, vale xt) + yg(t) + zh(t) = 0. 


Assim, na equação x sent + y cos t + zt = 0 


(1) tomamos t = O e obtemos x(0) + y(1) + 2(0) = O ou y=0; 
(ii) tomamost = 7/2 e obtemos xD) +y(0)+2z7/2=0 ou x+77/2=0; 
(iii) tomamos £ = 7 e obtemos x(0)+y(-D) +z(7) =0 ou -y+n72=0, 


As três equações só têm a solução nula, ou seja, x = 0, y = 0, z = 0. Assim, f, g, h são linearmente independentes. 


4.22 Suponha que os vetores u, v, w sejam linearmente independentes. Mostre que os vetores u + v, u — v, 
u — 2v + w também são linearmente independentes. 


Considere x(u + v) + y(u — v) + z(u — 2v + w) = 0. Então 
xu + xu + yu — yv + zu — 2zv + zw = 0 


ou 


(x+y +zju +(x- y- 2zjv+zw=0 
Como u, v, w são linearmente independentes, os coeficientes da última equação são todos nulos, portanto, 
x+y+z=0, x—-y-22=0, z=0 


A única solução desse sistema homogêneo é x = 0, y = 0, z = 0. Assim, u + v, u — v, u — 2v + w são linearmente 
independentes. 


4.23 Mostre que os vetores u = (1 + i, 2i) e w = (1, 1+ i) de C? são linearmente dependentes sobre o corpo 
complexo C mas linearmente independentes sobre o corpo real R. 


Lembre que dois vetores são linearmente dependentes (sobre um corpo K) se, e só se, um deles é um múltiplo do outro 
(com algum elemento de K). Como 


((+ğw=(1+ġ(1, 1+ = (1 +i, 2 =u 


temos que u e v são linearmente dependentes sobre C. Por outro lado, u e v são linearmente independentes sobre R, pois 
nenhum múltiplo de w pode ser igual a u. Mais precisamente, dado r real, o primeiro componente de rw = (r, r + ri) é, 
necessariamente, real e, portanto, nunca pode ser igual ao primeiro componente 1 + i de u, que é complexo. 


Base e dimensão 


4.24 Decida se os vetores dados formam uma base de R, nos casos seguintes. 
(a) (1,1,1), (1,0,1); top Ai (AS (2;=1,1); 
6) (2:3) 3:5) (1:0, 1) (2,3,0); (d) (1,1,2), (1,2,5), (5,3,4). 


(a e b) Não formam, pois uma base de R? deve ter exatamente três elementos, já que dim R? = 3. 
(c) Os três vetores formam uma base se, e só se, são linearmente independentes. Por isso, formamos a matriz cujas 
linhas são os vetores dados e reduzimos a matriz à forma escalonada, como segue. 


1 11 1 1 1 111 
1 2 3/10 1 24-10 1 2 
2 —1 1 0 -3 + 0 0 5 


A matriz escalonada não tem linhas nulas, portanto, os três vetores são linearmente independentes, ou seja, formam 
uma base. 


(d) Formamos a matriz cujas linhas são os vetores dados e reduzimos a matriz à forma escalonada, como segue. 


1 1 2 1 1 2 112 
1 2 5|- 10 1 31-10 1 3 
53 4 0 —2 —6 0 0 0 


A matriz escalonada tem uma linha nula, portanto, os três vetores são linearmente dependentes, ou seja, não for- 
3 
mam uma base de R`. 


TU  Árcesra Linear 


4.25 


4.26 


4.27 


4.28 


Decida se (1, 1, 1, 1), (1, 2, 3, 2), (2,5, 6, 4), (2,6, 8, 5) formam uma base de Rº. Se não formarem, encontre 
a dimensão do espaço gerado. 


Formamos a matriz cujas linhas são os vetores dados e reduzimos à forma escalonada. 


1 1 1 1 1111 11 1 1 1 1 1 1 
B= 1 2 3 2f jO 12 1j fO 1 2 IH |O 12 1 
2 564 03 42 0 0 -2 -l 0 0 2 1 
2 6 8 5 0463 00 —2 =l 00 0 0 


A matriz escalonada tem uma linha nula, portanto, os quatro vetores são linearmente dependentes e não formam uma 
4 a A. ae Ps alia N 
base de R”. Como a matriz escalonada tem três linhas não nulas, os quatro vetores geram um subespaço tridimensional. 


Estenda {u; = (1,1,1,1),u = (2,2,3,4)+ a uma base de Rº. 


Começamos formando a matriz de linhas u, e u, e reduzimos à forma escalonada. 
11 11 1 1 11 
2 234 0 0 1 2 
Então vemos que w, = (1, 1, 1, 1) e w, = (0,0, 1, 2) geram o mesmo espaço gerado pelos vetores u, e u,. Sejam u, = (0, 


1, 0, 0) e u, = (0, 0, 0, 1). Então w,, u,, w,, u, formam uma matriz escalonada, portanto, são linearmente independentes 
4 . F] 4 
e formam uma base de R`. Assim, u,, u, Uz, u, também formam uma base de R'. 


Considere o corpo complexo C, que contém o corpo real R, que contém o corpo racional Q. (Assim, C é um 
espaço vetorial sobre R e R é um espaço vetorial sobre Q.) 


(a) Mostre que {1, i} é uma base de C sobre R; logo, C é um espaço vetorial bidimensional sobre R. 
(b) Mostre que R é um espaço de dimensão infinita sobre Q. 


(a) Dado qualquer v € C, temos v = a + bi = a(1) + b(i), coma, b € R. Logo, {1, i} gera C sobre R. Além disso, se 
xD) + y(i) = 0 ou x + yi = 0, com x, y € R, então x = 0 e y = 0. Logo, {1, i} é linearmente independente sobre 
R. Assim, {1, i} é uma base de C sobre R. 


(b) E sabido que 7 é um número transcendente, ou seja, 7 não é uma raiz de polinômio algum sobre Q. Assim, dado n, 
osn + 1 números reais 1, 7, 7°, . . . , 7 são linearmente independentes sobre Q, e R não pode ter dimensão n sobre 
Q. Por isso, R tem dimensão infinita sobre Q. 


Seja S = (uy, t, . . - , Up } um subconjunto de V. Mostre que são equivalentes as definições A e B seguintes 
de base de V. 


(A) S é linearmente independente e gera V. 
(B) Cada v € V é uma combinação linear única de vetores de S. 


Digamos que (A) seja válida. Como S gera V, cada vetor v de V é uma combinação linear de vetores de S. Se tivermos 
duas combinações, digamos, 


U = Aju + azu + `+: F apun e u = byu; + bzu +-+: + bpn 


então obtemos 


0=v-v= (a; byJu; H (a boJu, pare (a, baum 
por subtração. Como os u, são linearmente independentes, todos os coeficientes dessa última combinação são nulos, ou seja, 
a—b, =0, a — b, = 0, ne a, — b, =0 


Logo, a} = b1, a = b;,...,a, = b, e as duas combinações são iguais. Isso mostra que vale (B), pois a representação 
de v como combinação linear de vetores de S é única. Assim, (A) implica (B). 
Digamos que (B) seja válida. Então S gera V. Suponha que 


0O=cum+cu++cmu, 
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No entanto, temos 
0 = Ou, + Ou +-+: + Ou, 


Por hipótese, a representação de O como combinação linear dos u, é única. Logo, cada c; = 0 e os u; são linearmente 
independentes. Assim, (B) implica (A). 


Dimensão e subespaços 


4.29 Encontre uma base e a dimensão do subespaço W de R? nos casos seguintes. 


4.30 


431 


4.32 


(a) W=tf(a,bc):a+b+c=0), (b) W = {(a,b,c): (a=b = c¢)} 


(a) Observe que W £ R, já que, por exemplo, (1,2,3) & W. Assim, dim W < 3. Observe que u, = (1, 0, —1) eu, = 
(0, 1, —1) são dois vetores independentes de W. Assim, dim W = 2 e, portanto, u, e u, formam uma base de W. 


(b) O vetoru = (1,1,1) € W. Qualquer vetor w € W é da forma w = (r, r, r). Logo, w = ru. Assim, u gera W e dim 
W=1. 


Seja W o subespaço de Rº gerado pelos vetores 
uy = (1,:=2,5,=3); Uy = (2,3,1, —4), uz = (3,8, —3, —5) 


(a) Encontre uma base e a dimensão de W. (b) Estenda a base de W a uma base de R'. 


(a) Utilizamos o Algoritmo 4.1 do espaço linha. Formamos a matriz cujas linhas são os vetores dados e reduzimos à 
forma escalonada. 


l- —2 S 3 1 =2 5 —3 1 —2 5 —3 
A=|2 3 1 4/10 71 —9 21-10 7 =) 2 
3 8 —3 =5 0 14 —18 4 0 0 0 0 


As linhas não nulas (1, —2, 5, -3) e (0, 7, —9, 2) da matriz escalonada formam uma base do espaço linha de A e, 
portanto, de W. Em particular, dim W = 2. 


(b) Queremos encontrar quatro vetores linearmente independentes que incluam os dois vetores de (a). Os quatro 
vetores (1, —2, 5, 3), (0, 7, —9, 2), (0, 0, 1,0) e (0, 0, 0, 1) são linearmente independentes (porque formam uma 
matriz escalonada) e, portanto, formam uma base de Ri que estende a base de W. 


Seja W o subespaço de Rº gerado por u, = (1,2, —1,3,4), u, = (2,4, —2, 6,8) u = (1,3,2,2,6), 
us = (1,4,5,1,8), us = (2,7,3,3,9). Encontre um subconjunto desses vetores que forme uma base de W. 


Aqui utilizamos o Algoritmo 4.2 da eliminação. Formamos a matriz M cujas colunas (e não linhas) são os vetores dados 
e reduzimos à forma escalonada. 


1 2112 12 1 1 2 1211 2 

43 4 7 0 0 1 2 3 00172 3 

M=|-1 2253]-]0 0 3 6 S|-|10 0 0 0 —4 
3 6213 0 0 -1 -2 -3 0000 0 

4 8 6 8 9 00 2 4 1 0000 0 


As posições dos pivôs são nas colunas C,, C, e C,. Logo, os correspondentes vetores u, U, € u; formam uma base de W 
edim W = 3. 


Seja V o espaço vetorial das matrizes 2 x 2 sobre K. Seja W o subespaço das matrizes simétricas. Mostre 
que dim W = 3 encontrando uma base de W. 


: E e P T $ E a b 
Lembre que uma matriz A = la, é simétrica se 4 = A ou, equivalentemente, se cada aj = ai Assim, Á = | | 


b d 
denota uma matriz 2 x 2 simétrica arbitrária. Tomando (i) a = 1, b = 0, d = 0; (ii) a = 0, b = 1, d = 0; (iii) a = 0, 
b = 0, d = 1, obtemos as respectivas matrizes 


10 01 00 
ashob asf oh S=[01] 


H  Árcesra Linear 


Afirmamos que S = (E,, E,, E,) é uma base de W, ou seja, (a) S$ gera We (b) S é linearmente independente. 


b 
(a) A matriz dada satisfaz 4 = 5 A = aE, + bE, + dE}, Assim, S gera W. 


(b) Seja xE, + yE, + zE; = 0, com x, y, z incógnitas escalares. Ou seja, 
1 0 01 0 0| JO 0 x y|_ |0 0 
do oltli olto islo o] œ B zl- le 6] 


Igualando as entradas correspondentes, obtemos x = 0, y = 0, z = 0. Logo $ é linearmente independente. Assim, S é 
uma base de W, conforme afirmamos. 


Teoremas sobre dependência linear, bases e dimensão 


4.33 


4.34 


4.35 


Demonstre o Lema 4.10. Suponha que dois ou mais vetores v,, v, ..., v, Sejam linearmente dependentes. 
Então algum dos vetores é uma combinação linear dos vetores que o antecedem. 


Como os v; são linearmente dependentes, existem escalares a}, ..., a 
Seja k o maior inteiro tal que a, 0. Então 


não todos nulos tais que av, + + + apm Um = 0. 


m 


avec + agU + Ovo + + Ou, 0 ou au +: +a = 0 


Suponha que k = 1. Então a; v; = 0, a, # 0e, portanto, v, = 0. Como os v, são vetores não nulos, estabelecemos que 
k> 1 e obtemos 


—1 —1 
Uk = Ad MV Ak dp Up 


Isso mostra que v, é uma combinação dos vetores que o antecedem. 


Seja S = {v}, v, ..., Un} um conjunto gerador do espaço vetorial V. 


(a) Sew € V, então (w, v,,..., Um} é linearmente dependente e gera V. 

(b) Se v, é uma combinação linear de v,,..., v; , então S sem v, ainda gera V. 

(a) O vetor w é uma combinação linear dos v, porque S gera V. Por isso, {w, V4, - . ., Um } é linearmente independente. 
Certamente, w junto com os 7, ainda gera V, porque os v, geram V, ou seja, (W, vj,..., Um} gera V. 


(b) Digamos que v; = kvi +++: +k; ,v;1 Sejau € V. Como S gera V, u é uma combinação linear dos v, digamos, 
u = d4 V1 +--: + 4, Um Substituindo v, nessa expressão, obtemos 


u = dvd + djati + alkin do kiita) aa dp dy 


= (a; + aki) vy +i + (aji +ak vo F aigi Viga do + Am 


Assim, (v1,..., Ut, Vil -+ Um) gera V. Em outras palavras, podemos tirar v, do conjunto gerador e continuar com 
um conjunto gerador. 


Demonstre o Lema 4.13. Se ([v,, v,,...,v,) gera Ve [w,, Wz, ..., W,,) é linearmente independente, então m < n 
e Vé gerado por um conjunto da forma 


DM eso Vio Uige ti) 
Assim, n + 1 ou mais vetores de V são linearmente dependentes. 
Basta provar o lema no caso em que nem todos os v, são nulos. (Verifique isso!). Como (v,) gera V, o Problema 4.34 


garante que 


(rn Vic Un} (1) 


é linearmente dependente e também gera V. Pelo Lema 4.10, algum dos vetores de (1) é uma combinação linear dos 
vetores que o antecedem. Esse vetor não pode ser w,, portanto, deve ser um dos v, digamos, v, Assim, pelo Problema 
4.34, podemos tirar v, do conjunto gerador (1) e obter o conjunto gerador 


(Mais v Dis Voto ces Un) (2) 


4.36 


4.37 


4.38 


4.39 
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Agora, repetimos o argumento com o vetor w,, ou seja, por (2) gerar V, o conjunto 
{Wi W2, Uis- 3 Ur Vac co Un) (3) 


é linearmente dependente e também gera V. Novamente, pelo Lema 4.10, algum dos vetores de (3) é uma combinação 
linear dos vetores que o antecedem. Enfatizamos que esse vetor não pode ser w, ou w,, porque {w}, ..., W,,) é linearmen- 


te independente; portanto, deve ser um dos v, digamos, v,. Assim, pelo Problema 4.34, podemos tirar v, do conjunto 
gerador (3) e obter o conjunto gerador 


(wi, w2, Vo: <3 UI Vo cs Up Valeo Un) 
Repetimos o argumento com o vetor w,, e assim por diante. Em cada passo, conseguimos acrescentar um dos vetores w; 
e tirar um dos v; do conjunto gerador. Se m < n, obtemos dessa maneira um conjunto gerado da forma desejada, 


{Wis Wm Viteo Ui } 


n-m 


Finalmente, mostramos que não é possível ter m > n. De fato, nesse caso, depois de n passos, obteríamos o conjunto 
gerador {w}, ..., w,). Isso implicaria que w, ,, é uma combinação linear de w,, ..., w,, contradizendo a hipótese de inde- 
pendência linear do conjunto {w}, ..., W }- 


nº 


Demonstre o Teorema 4.12. Todas bases de um espaço vetorial V têm o mesmo número de elementos. 


Sejam {u}, 45, ..., U,) € (v,, V, ...) duas bases de V. Como (u,) gera V, a base (v,, v, ...) não pode ter mais do que n ele- 
mentos, pois, caso contrário, seria linearmente dependente pelo Problema 4.35 — Lema 4.13. Por outro lado, se a base ( 
Vi, V, -..) contivesse menos do que n elementos, então {u}, u, ..., 4,) seria linearmente dependente pelo Problema 4.35. 
Assim, a base (v,, V, ...) contém exatamente n elementos, provando o teorema. 


Demonstre o Teorema 4.14. Se V for um espaço vetorial de dimensão finita n, valem as afirmações seguintes. 
(1) Quaisquer n + 1 ou mais vetores de V são linearmente dependentes. 
(11) Qualquer conjunto linearmente independente S = {u}, tz, ..., U„} com n elementos de V é uma base de V. 
(iii) Qualquer conjunto gerador T = {v}, v, ...,v,) de Vcom n elementos é uma base de V. 

Seja B = {w}, W» ..., W,) uma base de V. 
G) Como B gera V, quaisquer n + 1 vetores são linearmente dependentes pelo Lema 4.13. 


(ii) Pelo Lema 4.13, podemos acrescentar a § alguns elementos de B até formar um conjunto gerador de V com n 
elementos. Como 5 já tem n elementos, S já e um conjunto gerador de V. Assim, S é uma base de V. 


(iii) Suponha que T seja linearmente dependente. Então, algum v, é uma combinação linear dos vetores que o antecedem. 
Pelo Problema 4.34, V é gerado pelos vetores de T sem v,e há n — 1 deles. Pelo Lema 4.13, o conjunto linearmente 
independente B não pode ter mais do que n — 1 elementos. Isso contradiz o fato de que B tem n elementos. Assim, 
T é linearmente independente e, portanto T é uma base de V. 


Demonstre o Teorema 4.15. Se S for um conjunto gerador de um espaço vetorial V, valem as afirmações 
seguintes. 


(i) Qualquer subconjunto linearmente independente máximo de S constitui uma base de V. 


ii) Excluindo de S cada vetor que for uma combinação linear dos vetores de S que o antecedem, os vetores 
que sobram em S constituem uma base de V. 


G) Suponha que {v}, ..., v,) seja um subconjunto de § com número máximo de elementos linearmente independentes 
e consideremos (v,,..., Um, W}. Então, (0, ..., U,, w} é linearmente dependente. Como nenhum v, pode ser uma 
combinação linear de vetores que o antecedem, necessariamente w é uma combinação linear dos v,. Logo, w € ger 
(v;) e, portanto, S C ger (v,). Isso mostra que 


V = ger (S) Cger(u) CV 
Assim, (v,) gera Ve, por ser linearmente independente, é uma base de V. 
Demonstre o Teorema 4.16. Sejam V um espaço vetorial de dimensão finita e S = (u,, Uz, ..., 4,) um con- 


junto de vetores linearmente independentes de V. Então S é parte de uma base de V, ou seja, S pode ser 
estendido até uma base de V. 
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Suponha que B = (w,, w,, ..., w„} seja uma base de V. Então B gera V e, portanto, V é gerado por 
SUB = {u1 uz,- -Ups Wi, Wa. Wa 


Pelo Teorema 4.15, podemos tirar de S U B cada vetor que seja uma combinação linear de vetores que o antecedem 
até obter uma base B’ de V. Como S é linearmente independente, nenhum u, é uma combinação linear de vetores que o 
antecedem. Assim, B’ contém cada vetor de S e, portanto, S é parte da base B’ de V. 


Demonstre o Teorema 4.17. Seja W um subespaço do espaço vetorial V de dimensão n. Então W < n. Em 
particular, se dim W = n, então W = V. 


Como V tem dimensão n, quaisquer n + 1 vetores são linearmente dependentes. Além disso, como uma base de W con- 
siste em vetores linearmente independentes, não pode conter mais do que n elementos. Por isso, W < n. 

Em particular, se {w}, ..., w,) for uma base de W, então, por ser um conjunto linearmente independente de n elementos, 
também é uma base de V. Assim, W = V quando dim W = n. 


Posto de uma matriz, espaços linha e coluna 


4.41 Encontre o posto e uma base do espaço linha de cada uma das matrizes seguintes. 
13 1 =2 —3 


1 2 0 — 
@ d= |) 6 -3 <S|; upel? TE 
3 10 -6 5 2 3 —4 -7 -3 
3 8 1 -7 —8 
(a) Reduzimos A à forma escalonada 
12 0 — 1 2 0 — 
A~ |0 2 -3 1/0102 -3 -l1 
0 4 —6 -2 0 0 0 0 


As duas linhas não nulas (1, 2, 0, —1) e (0, 2, -3, —1) da forma escalonada de A formam uma base de lin(A). Em 


particular, pos(A) = 2. 
(b) Reduzimos B à forma escalonada 


1 3 1 =2,=3 | 3 L =2 =3 
Bo 0 1 2 1 —1j |0 1 2 1 — 
0 -3 —6 -3 3 000 0 0 
O =] =2 =l 1 0 0 0 0 0 


As duas linhas não nulas (1, 3, 1, —2, —3) e (0, 1,2, 1, —1) da forma escalonada de B formam uma base de lin(B). 


Em particular, pos(B) = 2. 


4.42 Mostre que U = W, sendo U e W os subespaços seguintes de RÌ. 


U = ger(u,, u, u) = ger{(1, 1, —1), (2, 3, —1), (3, 1, -5)} 
W = ger(w, W» w3) = ger{(1, —1, -3), 3, -2, -8), (2, 1, -3)} 
Formamos a matriz A cujas linhas são os u, e reduzimos A à forma canônica por linhas. 


11 + 1 1 — 1 0 — 
A=|2 3 1/10 1 1jfj~ 10 1 1 
3 D =5 0 =2 =2 0 0 0 


Em seguida, formamos a matriz B cujas linhas são os w, e reduzimos B à forma canônica por linhas. 


1 —-1 —3 L s —3 1 0 — 
B=|3 =2 8|-|0 1 ljf~ 10 1 1 
2 1 —3 0 3 3 0 0 


Como A e B têm a mesma forma canônica por linhas, os espaços linha de A e B são iguais, ou seja, U = W. 
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Zi 2 3 À 

; 2 43 7 7 4 

4.43 Seja 4 = 122 5 5 6 
3 6 6 15 14 15 


(a) Encontre pos(M,), com k = 1, 2, ..., 6, sendo M, a submatriz de A consistindo nas k primeiras colunas 
Cis Casies Cde A: 


(b) Quais das colunas C, ,, são combinações lineares das colunas C,, ..., C, que as antecedem? 
(c) Encontre colunas de A que formam uma base do espaço coluna de A. 
(d) Escreva a coluna C, como uma combinação linear das colunas da parte (c). 


(a) Reduzimos A à forma escalonada, como segue. 


1.2 123 1 1 2 12 3 1 
dis 00131 2/./0013 12 
0013 2/5 0000 13 
003 9 512 000000 


Observe que simultaneamente reduzimos todas as matrizes M, à forma escalonada. Por exemplo, as quatro primei- 
ras colunas da forma escalonada de A são uma forma escalonada para M,. Sabemos que pos(M,) é igual ao número 
de pivôs ou, equivalentemente, ao número de linhas não nulas numa forma escalonada de M,. Assim, 


pos(M,) = pos(M,) = 1, pos(M;) = pos(M,) = 2 
pos(Ms) = pos (M6) =3 


(b) A equação vetorial x; C1 + xX2C3 +--+ + x, Cy = Cy fornece o sistema com matriz de coeficientes M, e matriz 
aumentada M, , ,. Assim, C, , é uma combinação linear de C}, ..., C, se, e só se, pos(M,) = pos(M, , |) ou, 
equivalentemente, se C, , , não contém algum pivô. Assim, cada uma das colunas C,, C, e C, é uma combinação 
linear das colunas que a antecedem. 


(c) Na forma escalonada de A, os pivôs estão nas primeira, terceira e quinta colunas. Assim, as colunas C,, C}, C; de A 
formam uma base do espaço coluna de A. Alternativamente, eliminando as colunas C,, C}, C; do conjunto gerador 
de colunas (são combinações lineares de outras colunas) obtemos, de novo, C,, C}, Cs. 


(d) A matriz escalonada nos diz que C, é uma combinação linear das colunas C, e C,. A matriz aumentada M da 
equação vetorial C, = xC, + yC, consiste nas colunas C,, C}, C, de A que, reduzida à forma escalonada, fornece a 
matriz (omitindo as linhas nulas) seguinte. 


Assim, C,=-C,+3C,=-C,+3C,+0C,. 
4.44 Suponha que u = (a,, a, ..., a,) seja uma combinação linear das linhas R,, R,, ..., R, de uma matriz B = [b,), 
digamos, u = ki Ri + kR, + +--+ kyRym Mostre que 


a; = kb, + koba + + km i=1,2,...,n 
onde b;;, b5;,..., bmi São as entradas da i-ésima linha de B. 
É dado que u = kı Ri + kR + +- + KR, Então, 


(aj, az,- , ap) = kı (bii, ---, bin) a E 
= (kibi aerei + hmm + ,kibin qee + kmbmn) 


Igualando entradas correspondentes, obtemos o resultado esperado. 


4.45 Demonstre o Teorema 4.7. Sejam A = [a;] e B = [b,] duas matrizes escalonadas equivalentes por linhas 
com respectivas entradas pivô 


aijo A2 Ay; e Diko Dako eco Bsk, 
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j-ésima coluna de B. Assim, de (2), decorre que q; = cb 


(representadas na Figura 4-5). Então A e B têm o mesmo número de linhas não nulas, ou seja, r = s, e as 


entradas pivô estão nas mesmas posições, ou seja, j = kija = ko, -Jp = kp. 
ay X k k HH bip X x$ k x x x 
dy; * kx k*k * b xo k * * 
j= 2ja = 2k 
Ay, * ba, * * 
Figura 4-5 


Claramente, A = 0 se, e só se, B = 0 e, portanto, basta demonstrar o teorema com r > les > 1. Primeiro mostramos 
que j, = k,. Suponha que j, < k,. Então a coluna j, de B é nula. Como a primeira linha R* de A está no espaço linha de B, 
temos R* = cR; + c;R; + +° + Cy Rm onde R, são as linhas de B. Como a coluna j, de B é nula, temos 


dj, 


=00+c,0+---+c,0=0 

Mas isso contradiz o fato de que a entrada pivô 41; # 0. Logo, ji > ke, analogamente, k, > j}. Assim, j, = k. 
Agora, seja A’ a submatriz de A obtida suprimindo a primeira linha de A e seja B’ a submatriz de B obtida suprimindo a 
primeira linha de B. Vamos provar que A’ e B’ têm o mesmo espaço linha. Com isso, o teorema resulta demonstrado por 
indução, pois A’ e B’ também são matrizes escalonadas. 


Seja R = (a,, à,, ..., a,) uma linha qualquer de A’ e sejam R,, ..., R, as linhas de B. Como R está no espaço linha de B, 
existem escalares d,, ..., d, tais que R = d R; + d;R, + -:: + d,R, Como A é uma matriz escalonada e R não é a 
primeira linha de A, a entrada j, de R é nula: a, = 0, comi = j, = k,. Além disso, como B é uma matriz escalonada, todas 
as entradas da coluna k, de B são nulas, exceto a primeira: bi, +Æ 0, mas bo, = O, cr Dk = 0, Logo, 

0= ak = dibir, } d0 ec + dO = dibir, 


Agora, bj, 5 0 e, portanto, d, = 0. Decorre que R é uma combinação linear de R,, ..., R, e, portanto, está no espaço 
linha de B’. Como R foi uma linha qualquer de 4’, resulta que o espaço linha de A’ está contido no espaço linha de B’. 
Analogamente, o espaço linha de B’ está contido no espaço linha de 4". Assim, A’ e B’ têm o mesmo espaço linha e o 
teorema resulta demonstrado. 


Demonstre o Teorema 4.8. Sejam A e B matrizes em forma canônica por linhas. Então A e B têm o mesmo 
espaço linha se, e só se, A e B têm as mesmas linhas não nulas. 


Obviamente, se A e B têm as mesmas linhas nulas, então têm o mesmo espaço linha. Logo, basta provar a recíproca. 
Suponha que A e B tenham o mesmo espaço linha e suponha que R O seja a i-ésima linha de A. Então existem esca- 
lares c,,..., C, tais que 


R=cRyi+HoR,+-c+cR, (1) 


em que R; são as linhas não nulas de B. O teorema está provado se mostrarmos que R = R, ou seja, que c; = 1, masc, 
= 0, com k Æ i. 
Seja a, a entrada pivô de R, ou seja, a primeira entrada não nula de R. Por (1) e o Problema 4.44, 

dij, = cibi; + Coby;, ++ Cod (2) 
Mas, pelo Problema 4.45, bj, é um pivô de B e, como B está em forma canônica por linhas, é a única entrada não nula da 
ij: Contudo, a;; = le b;, = 1, porque A e B estão em forma 
canônica por linhas, portanto, c, = 1. 
Agora, suponha que k +Æ ie seja bij, a entrada pivô de R,. Por (1) e o Problema 4.44, 


| Lg im 2 n 
dij, = Cibi, + Cabaj, dec + cod, (3) 


Como B está em forma canônica por linhas, bij, é a única entrada não nula da j-ésima coluna de B. Assim, de (3), decor- 


requea, = Ch bij Além disso, pelo Problema 4.45, 44; é uma entrada pivô de A e, como A está em forma canônica por 


ijg 
linhas, a; = 0. Assim, Cbg, = 0 e, como by, = 1, resulta c, = 0. Por isso, R = R, demonstrando o teorema. 


Demonstre o Corolário 4.9. Toda matriz A é equivalente por linhas a uma única matriz em forma canônica 
por linhas. 
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Suponha que A seja equivalente por linhas às matrizes A, e A,, ambas em forma canônica por linhas. Então lin(A) = 
lin(A,) e lin(A) = lin(A;). Logo, lin(A,) = lin(A,). Como A, e A, estão em forma canônica por linhas, o Teorema 4.8 
garante que A, = A,, provando o corolário. 


4.48 Suponha que os produtos RB e AB estejam definidos, sendo R um vetor linha e 4 e B matrizes quaisquer. 
Demonstre as afirmações seguintes. 


(a) RB é uma combinação linear das linhas de B. 

(b) O espaço linha de AB está contido no espaço linha de B. 

(c) O espaço coluna de AB está contido no espaço coluna de A. 

(d) Se C for um vetor coluna e AC estiver definido, então AC é uma combinação linear das colunas de A. 
(e) pos(4B) < pos(B) e pos (4B) < pos (4). 


(a) Suponha que R = (a, a, ..,a,)eB = [b;]. Sejam B}, ..., B, as linhas de B e B', ..., B” suas colunas. Então 


RB = (RB!,RBº,...,RB”) 
= (ab + abay ++ ambm co Abin + abon +: + Amb) 
= a; (b11, b12,- +, bin) + a2 (bzr, boas... , ban) + ooo + Am (bmi bms- -s Dmm) 
= a;B; +a,B,+-:-+a,B, 


Assim, RB é uma combinação linear das linhas de B, como queríamos mostrar. 


(b) As linhas de AB são RB, em que R, é a i-ésima linha de A. Logo, pela parte (a), cada linha de AB está no espaço 
linha de B. Assim, lin(AB) c lin(B), como queríamos mostrar. 


(c) Usando a parte (b), temos col (AB) = lin (AB)” = lin (BTAT) C lin (A7) = col (A). 
(d) Decorre de (c), trocando B por C. 


(e) O espaço linha de AB está contido no espaço linha de B, logo, pos(4B) < pos(B). Além disso, o espaço coluna 
de AB está contido no espaço coluna de A, logo, pos (4B) < pos (4). 


4.49 Seja A uma matriz. Mostre que 4 é invertível se, e só se, pos(A) = n. 


Observe que as linhas da matriz identidade 7, de ordem n são linearmente independentes, porque 7, está em forma esca- 
lonada; logo, pos([,) = n. Sendo A invertível, temos que A é equivalente por linhas a Z,, portanto, pos(A) = n. Se A não 


for invertível, então A é equivalente por linhas a uma matriz com alguma linha nula, portanto, pos(A) < n. Assim, A é 
invertível se, e só se, pos(A) = n. 


Aplicações a equações lineares 


4.50 Encontre a dimensão e uma base do espaço solução W de cada sistema homogêneo dado. 


x+2y+2z2z—-s+3t=0 x+2y+ z—-2t=0 x+ y+22=0 
x+2y+3z2+4+s+ t=0 2x+4y+42—-3t=0 2x+3y +32 =0 
3x+6y+82+5s+51=0 3x+6y +72 —-4t=0 x+3y+52=0 


(a) (b) (c) 


(a) Reduzimos o sistema à forma escalonada, como segue. 


x+2y+22—- s+3t=0 x+2y+22—- s+34=0 
z+2s-—-2t=0 ou z+2s-2t=0 
2z+4s—4t=0 


O sistema está em forma escalonada e tem duas equações (não nulas) com cinco incógnitas. Logo, o sistema tem 5 
— 2 = 3 variáveis livres, que são y, s, t. Assim, dim W = 3. Para uma base de W, 

(1) tomamos y= 1,s=0,t=0O eobtemos a solução «v, = (-2, 1, 0, 0, 0); 

(2) tomamosy =0,s=1,t=0O eobtemos a solução wv, = (5, 0, -2, 1, 0); 

(3) tomamos y = 0,s =0,ż=1 eobtemos a solução ~v, = (-7, 0, 2, 0, 1). 


O conjunto (v,, v,, v;) é uma base do espaço solução W. 
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(b) (Aqui utilizamos o formato matricial do nosso sistema homogêneo.) Reduzimos a matriz de coeficientes A à forma 
escalonada, como segue. 


121 72 1 2 1 -2 121 =2 
A=|2 4 4 3|-10 0 2 ljļ~]]O0O 0 2 1 
3 6 7 —4 004 2 000 0 


Isso corresponde ao sistema 

x+2y+2z-2t=0 

2z+ t=0 
As variáveis livres são y e t, sendo dim W = 2. Para uma base de W, 
(1) tomamos y = 1,t = 0 e obtemos a solução u, = (-2, 1, 0, 0); 
(2) tomamos y = 0, t = 2 e obtemos a solução u, = (6, 0, —1, 2). 
Então (u,, u,) é uma base de W. 
(c) Reduzimos a matriz de coeficientes A à forma escalonada, como segue. 


112 11 11 2 
A=|233|-/0 1 -1|[-10 1 -1 
1 Bos 02 0 0 5 


Isso corresponde a um sistema triangular sem variáveis livres. Assim, O é a única solução, ou seja, W = {0} e dim 
W=0. 


4.51 Encontre um sistema homogêneo cujo espaço solução W seja gerado por 


{ui u, u3} = {(1, —2, 0,3), (1,-1,-1,4), (1,0, —2,5)} 


Seja v = (x, y, z, t). Então v € W se, e só se, v é uma combinação linear dos vetores (u,, u,, u;) que geram W. Por isso, 
formamos a matriz M cujas primeiras colunas sejam u,, u,, u, € cuja última coluna seja v e, depois reduzimos M à forma 
escalonada, como segue. 


1 1 l x 1 1 1 x 1 1 1 x 
M= -2 -l1 O y| |0 2 2x+y 012 2x +) 

O =1 2 Z 0 =l =2 Z 0 0 0 2x+y+z 

3 4 5t 0 1 2 —3x+t 0 0 0 —5x-y+t 


Então v é uma combinação linear de u,, u,, u, se pos(M) = pos(A), em que A é a submatriz sem a coluna v. Assim, 
tomamos as duas últimas entradas na quarta coluna do lado direito como sendo nulas para obter o sistema homogêneo 
procurado, ou seja, 


2x+y+z =0 

5x +y —t=0 
4.52 Sejam X;,X;,---,X; as variáveis livres de um sistema homogêneo de equações lineares com n incógnitas. 
Seja v, a solução para a qual X, = le todas as demais variáveis livres iguais a 0. Mostre que as soluções v,, 


V, -.., V, SãO linearmente independentes. 


Seja A a matriz cujas linhas são os v,. Trocamos entre si as colunas 1 e i,, depois as colunas 2 e i, e assim por diante, até 
as colunas k e i,, obtendo a matriz k x n 


1 0 0 . 0 0 cm Gin 
B=[,Cl= 0 10 . 0 0 ma Con 
0 0 0 0 1 Ck k+1 Chn 


Essa matriz B está em forma escalonada, portanto, suas linhas são independentes e, dessa forma, pos(B) = k. Como A e 
B são equivalentes por colunas, têm o mesmo posto e resulta pos(A) = k. Como A tem k linhas, decorre que essas linhas 
(ou seja, os v;) são linearmente independentes, como queríamos mostrar. 
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Somas, somas diretas, interseções 


4.53 Sejam U e W subespaços de um espaço vetorial V. Mostre que 


(a) 
(b) 
(c) 
(d) 
(a) 


(b) 


(c) 


(d) 


U + W é um subespaço de V; 

U e W estão contidos em U + W; 

U + W é o menor subespaço de V que contém U e W, ou seja, U + W = ger(U, W); 
W+W=W. 


Como U e W são subespaços, 0 € U e 0 € W. Logo, 0 = 0 + 0 pertence a U + W. Sejam v, v! € U + W. Então 
v=u+wev =u +v,comu,u € Uew,w € W. Segue que 


av + bv = (au+bu)+(aw+bw) EU +W 


Assim, U + W é um subespaço de V. 


Seja u E€ U. Como W é um subespaço, 0 E€ W. Logo u = u + O pertence a U + W. Assim, U C U +W. 
Analogamente, W C U + W. 


Como U + W é um subespaço de V que contém U e W, também contém o espaço gerado por Ue W, ou seja, ger 
(UWM)CU+YW. 


Por outro lado, se v E€ U + W, então v = u + w = lu + Iw,comu E€ U e w € W. Logo, v é uma combinação 
linear de elementos de U U W e, portanto, v € ger(U, W). Assim, U + W Cger(U,W) 
As duas inclusão mostram a igualdade dos conjuntos. 


Como W é um subespaço de V, sabemos que W é fechado perante a adição vetorial, ou seja, W + W C W. Pela 
parte (a) W C W + W. Assim, W + W = W. 


4.54 Considere os subespaços de R? dados a seguir. 


U = ger(u,u,,us)= ger((1,3,-2,2,3), (1,4,-3,4,2), (2,3,-1,-2,9)) 
W = ger(w,,W2,W3) = ger ((1,3,0,2,1), (1,5,=6,6,3), (2,5,3,2,1)} 


Encontre uma base e a dimensão de (a) U + W, (b) U NA W. 


(a) 


(b) 


U + W é o espaço gerado por todos os seis vetores. Portanto, formamos a matriz cujas linhas são os dados seis 
vetores e reduzimos à forma escalonada, como segue. 


13 —2 2 3 1 3. =2 2 3 13 22 3 
1 4 —3 42 0 1 — 2 -1 0 1 -1 2 -l 
2 3 -1 —2 9 0 —3 3 —6 3 0 0 1 0 -=l 
1 3 0 2 1 0 0 2 0 —2 0 0 0 0 0 
1 5 —6 6 3 0 2 —4 4 0 0 0 0 0 0 
2 5 3 21 0 — T =2 55 0 0 0 0 0 
As linhas não nulas seguintes da matriz escalonada formam uma base de U N W, 
(1,3,-2,2,2,3), (0,1,-1,2,-—1), (0,0,1,0, —1) 


Assim, dim(U + W) = 3. 


Seja v = (x, y, z, $, t) um elemento arbitrário de R5. Em primeiro lugar, escrevemos dois sistemas homogêneos 
cujos espaços solução sejam U e W, respectivamente, digamos, como no Problema 4.50. 
Formamos a matriz M de colunas u, e v e reduzimos à forma escalonada, como segue. 


1 1 2 x j 2 x 

3 4 3 y 0 1 -3 —3x +y 
M=|-2 -3 1 z|~ļ|0 0 0 -x+y+z 

2 4 -2 s 0 0 0 4x-2y+s 

3 2 9 t 0 0 0 -6x+y+t 


Igualando a zero as três últimas entradas da última coluna, obtemos o sistema homogêneo seguinte, cujo espaço solução é U. 


-x+y+2=0, 4x —-2y+5=0, —6x+y+t=0 
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4.55 


4.56 


4.57 


4.58 


Agora, formamos a matriz M’ de colunas w, e v e reduzimos à forma escalonada, como segue. 


1 1 2 x 1 1 2 x 

3 5 5 y 0 2 -1 —3x +y 
M=|0 -6 3 z|-|0 0 0 —9%x+3y+z 

2 6 2 s 0 0 O 4x—-2y+s 

| Di 4 00 0 Xx-y+t 


Novamente, igualando a zero as três últimas entradas da última coluna, obtemos o sistema homogêneo seguinte, cujo 
espaço solução é W. 


—9 +3 +z=0, 4x- 2y +s =0, 2x—-y+t=0 


Combinando ambos sistemas obtidos, resulta um sistema homogêneo de espaço solução iguala U N W que reduzimos 
à forma escalonada, obtendo 


=x +y+ 2 =0 
2y+42+ s =0 

82 +5s+2t=0 
s—2t=0 


Existe uma única variável livre, a saber, t, portanto, dim(U N W) = 1. Tomando ż = 2, obtemos a solução u = 
(1, 4, -3, 4, 2), que constitui a base procurada de U N W. 


Suponha que U e W sejam subespaços distintos de dimensão 4 de um espaço vetorial V de dimensão 6. En- 
contre as possíveis dimensões de U N W. 


Como U e W são distintos, U + W contém U e W propriamente e, portanto, dim(U + W) > 4. Mas dim(U + W) não pode 
ser maior do que 6, já que dim V = 6. Logo, temos duas possibilidades: (a) dim(U + W) = 5, ou (b) dim(U + W) = 6. 
Pelo Teorema 4.20, 


dim(U N W) = dim U + dim W — dim(U + W) = 8 — dim(U + W) 
Assim, (a) dim(U N W) = 3 ou (b) dim(U N W) =2. 


Sejam U e W os subespaços de Rº dados. 
U= {(a,b,c):a=b=c} e W = {(0, b, c)} 
(Observe que W é o plano yz.) Mostre que R? = U 6 W. 
Inicialmente, mostramos que U N W = (0) Suponha que v = (a, b,c) € U N W. Então a = b = c e a = 0. Logo, a 
= 0, b = 0, c = 0. Assim, v = 0 = (0, 0, 0). 
Em seguida, mostramos que R? = U + W. De fato, se v = (a,b,c) € R?, então 
v= (a,a,a) + (0,b — a,c — a), com (aaa) EU e (0, b-a, c-a)eW. 
Ambas condições U N W = {0} e U +W = R? implicam que R? = U ẹ W. 


Suponha que U e W sejam subespaços de um espaço vetorial V, que S = {u;} gere U e que S' = {w} 
gere W. Mostre que S U S' gera U + W. (Desse modo, por indução, se S; gera W, com i = 1, 2, ...,n, então 
Sy Use Sp geraW, Ee Wa 


Seja v E€ U + W. Então v = u + w,comu E€ U e w € W. Como S gera U, u é uma combinação linear de u, e, como 
S' gera W, w é uma combinação linear de w; digamos, 
u=aju, +Hau, + + apt; e v = biw; +bw, + + bw 


s Js 


em que 4;, b; € K. Então, 


v =u +W = aiu; +a; +: + a,u; +biw, +bw + + bw; 


Assim, SUS! = {u;, w;} gera U + W. 


Demonstre o Teorema 4.20. Sejam U e W subespaços de dimensão finita de um espaço vetorial V. Então U 
+ W tem dimensão finita e 


dim(U + W) = dim U + dim W — dim( U N W) 


4.59 


4.60 
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Observe que U N W é um subespaço tanto de U quanto de W. Digamos que dim U = m, dim W=nedim(UNW) =r. 
Seja [v,, ...v,) uma base de U N W. Pelo Teorema 4.16, podemos estender {v,} a uma base de U e a uma base de W. 
Digamos que 


Lopes Vo Ups Um e Lopes Ua Wises Wiat 


sejam bases de U e W, respectivamente. Seja 


B= {ve MR RR RA CAT | 


Observe que B tem, exatamente, m + n — r elementos. Assim, o teorema estará demonstrado se conseguimos mostrar 
que B é uma base de U + W. Como tw, u,} gera U e {v, w,) gera W, a união B = {v, u, w,) gera U + W. Assim, basta 
mostrar que B é linearmente independente. 

Suponha que 


Mv tava bju tt Da-rtm-r FCW + Cor =—0 (1) 


em que a, b, c, são escalares. Seja 


lp 


v= av preta a, U, H bju pessq Dm-rUm-r (2) 

Por (1), também temos 
U = CW" —CarWa-r (3) 

Como {vn u} C U, vE U, temos, por (2); e, como (we! C W, v E€ W, temos por (3). Desse modo, v E€ U N W. 
Agora, {v} é uma base de U N W, portanto, existem escalares d,, ..., d, para os quais v = dv, +--+ + d,v, Assim, 
por (3), temos 

div pae d,v, H am pered Cn—rWn-r = 0 
Mas (v, w,) é uma base de W, portanto, é independente. Logo, a equação precedente força c, = 0, ..., €C,- , = O. Subs- 
tituindo esses valores em (1), obtemos 

avı Rawsa a, U, } bju peri E aer =0 


Mas {v;, u;) é uma base de U, portanto, é independente. Logo, a equação precedente força a, = 0, ..., a, = 0, b, = 0,..., 
b =0. 


mr 


Como (1) implica que todos os a; b, c, são nulos, resulta que B = (v, Us w,} É independente, demonstrando o teorema. 


p Up 


Demonstre o Teorema 4.21. V = U @ W se, e só se, O) V = U + W, (ii) UN W = {0}. 
Suponha que V = U 9 W. Então cada v € V pode ser escrito de maneira única na forma v = u + w, em que u € U e 
w € W. Assim, em particular, V = U + W. Agora, suponha que v € U N W. Então 

d)v=v+0,emquev EU, 0E W,(2)v=0+v,emque0 EU, vE W 
Assim, v =0+0=0 e UNW = {0}. 
Por outro lado, suponha que V = U + W e que U N W = {0}. Seja v € V. Como V = U + W, existem u € U e 
w € W tais que v = u + w. Queremos mostrar que tal soma é única. Suponha que também tenhamos v = w’ + w’, com 
u EU e w € W. Então 

utw=u+w, e portanto, u-u =w -w 

Ambosu—u' €U e w —w €E W, portanto, como U N W = (0), resulta 


u—u =0, w-w=0, e portanto, u=u, w=w, 


Assim, uma tal soma para v € VéúnicaeV = U 9 W. 


Demonstre o Teorema 4.22 (para dois fatores). Suponha que V = U @ W e que S = (m,...,umjesS' = 
{w1;..-, Wp} sejam subconjuntos linearmente independente de U e W, respectivamente. Então valem as 
afirmações seguintes. 


(a) A união S U S' é linearmente independente em V. 
(b) Se Se S' forem bases de U e W, respectivamente, então S U S’ é uma base de V. 
(c) dim V = dim U + dim W. 


(a) Suponha que aju; +---+a 


Um + biwi +: + baw, = 0, em que a, b, sejam escalares. Então 


(au eas AmUm) H (biw; paeo bw) =0=0+0 
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ondeO,am ++ + apup EU e 0,biw; +: +b,w, E W. Como uma tal soma para 0 é única, isso nos 
leva a 


au + F apum = 0 e bw +- +b, w, =0 


Como $S é linearmente independente, cada a, = 0 e, como S' é linearmente independente, cada b, = 0. Assim, $S = 
S US é linearmente independente. 


(b) Pela parte (a), S = S US é linearmente independente e, pelo Problema 4.55, S = S U S' gera V = U + W. 
Assim, S$ = S US é uma base de V. 


(c) Segue imediatamente da parte (b). 


Coordenadas 
4.61 Em relação à base S = (u,, u,) = {(1, 1), (2, 3)} de RŽ, encontre as coordenadas do vetor v nos casos se- 
guintes. (a) v = (4, —3), (b) v = (a, b). 
Em cada caso, escrevemos 
v = xu +yu = x(1, 1) +y(2,3) = (x + 2y, x+ 3y) 


e resolvemos em x e y. 


(a) Temos 
= x+2y= 4 
(4,-3) = (x + 2y, x + 3y) ou gripes 
A solução é x = 18, y = —7. Assim, [v] = [18,7]. 
(b) Temos 
o x+2y=a 
(a,b) = (x + 2y, x+ 3y) ou x4 3y=b 


A solução é x = 3a — 2b, y = —a + b. Assim, [v] = [3a — 2b, —a + b]. 


4.62 Encontre o vetor de coordenadas de v = (a, b, c) em R? em relação à 
(a) base canônica E = {(1, 0, 0), (0, 1,0), (0,0, 1)), 
(b) base S = (u,, u,, us) = {(1, 1, 1), (1, 1, 0), (1, 0, 0)}. 
(a) Em relação à base canônica E, as coordenadas de [v]; são iguais às de v, ou seja, [v]; = [a, b, c]. 


(b) Escrevemos v como uma combinação linear de u,, u,, u, usando escalares x, y, z, obtendo 


a 1 1 1 x+y+z=a 
b| =x|1|+y|1|+z|0 ou x+y = 
c 1 0 0 x =c 


Resolvendo o sistema, obtemos x = c, y = b — c, z = a — b. Assim, [v]; = [c, b — ca — b]. 


4.63 Considere o espaço vetorial P}(f) dos polinômios de grau <3. 
(a) Mostre que S = ((t — 1), (t— DRA t— 1, 1) é uma base de P (^. 
(b) Encontre o vetor de coordenadas [v] de v = 3º — 4? + 2t — Sem relação a S. 


(a) O grau de (t — 1)“ é k. Escrevendo os polinômios de S em ordem invertida, vemos que nenhum dos polinômios de 
S é uma combinação linear dos polinômios que o precedem. Assim, os polinômios são linearmente independentes 
e, como dim P.(t) = 4, formam uma base de P.(t). 


(b) Escrevemos v como uma combinação linear dos vetores da base usando incógnitas escalares x, y, z, s, obtendo 
v=3P +44 +2-S=-1 +ylt -17 +z(t—1)+s(1) 
= SP +3t— to —2t+1)+z(t-1)+s(1) 
2 2yt+y+zt-z+s 


= xP = + 3xt — x + yt 


= xt + (3x +y)t + Bx — 2y +z)t+(-x+y-z+s) 
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Em seguida, igualamos os coeficientes de mesma potência t para obter 


£=3, —3x+y=4, 3x — 2y +z =2, x+y-z+s=-—5 


Resolvendo o sistema, obtemos x = 3, y = 13, z = 19, s = 4. Assim, [v] = [3, 13, 19,4]. 


2 3 
4.64 Encontre o vetor de coordenadas de 4 = 4 —7 |No espaço vetorial real M = My » em relação à 


pasa i st di sto tio 
(a) bases = li alli oo ajlo 
= ossec TA ORM] PO DA TO À 
(b) base canônica E = o ollo otli oplo ilt 
(a) Escrevemos A como uma combinação linear dos vetores da base usando incógnitas escalares x, y, z, t, como segue. 
|2 3j; |l 1 1 -1 1 -1 1 0|- |xtztt =y 
aa EE | th ol +:lo alteo JS x+y x 
Igualando entradas correspondentes, obtemos o sistema 


x+z+t=2, x—y—-72=3, x+y=4, x=—7 


Resolvendo o sistema, obtemos x 7,y = 11,z 21, t = 30. Assim, [A]; = [-7, 11, —21, 30]. (Observe que o 
vetor de coordenadas de A é um vetor de R*, pois dim M = 4.) 


(b) Escrevendo A como uma combinação linear das matrizes da base, obtemos 


2 3j |1 O ra da Og Re O o 7 

4 a7] "o o| o 6) "id o illz t 

Assim, x = 2, y = 3,z = 4,t 7. Assim, [A] = [2, 3, 4, —7], cujas entradas são os elementos de A escritos linha 
por linha. 


OBSERVAÇÃO Esse resultado é válido em geral, ou seja, se A for qualquer matriz m x n de M = M„ „ então as 
coordenadas de A em relação à base canônica de M são os elementos de A escritos linha por linha. 


4.65 No espaço M = M33, decida se as matrizes seguintes são linearmente independentes ou não. 


123 2 4 7 L 2 -5 
Fe B= C= 
lá 0 | E 1 HE E 2 o 
Se as matrizes forem linearmente dependentes, encontre a dimensão e uma base do subespaço W de M gerado pelas 


matrizes. 
Os vetores de coordenadas das matrizes dadas em relação à base canônica de M são os seguintes. 


[4] = [1,2,3,4,0,5], [B] = [2,4,7,10,1,13], [C] = [1,2,5,8,2,11] 
Formamos a matriz M cujas linhas são esses vetores de coordenadas e reduzimos M à forma escalonada. 


123 40 5 123 
M=|2 4 7 10 1 133]-/0 012/13 
1 2 5 0000 


Como a matriz escalonada tem somente duas linhas não nulas, os vetores de coordenadas [A], [B], [C] geram um espaço 
bidimensional e, portanto, são linearmente dependentes. Assim, os vetores A, B, C, são linearmente dependentes. Além 


disso, dim W = 2 e as matrizes 
L23 è “140 0 1 
Ho ads tela 13 


correspondentes às linhas não nulas da matriz escalonada constituem uma base de W. 
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Problemas variados 


4.66 


4.67 


4.68 


4.69 


4.70 


Considere uma sequência finita de vetores S = [v,, v, ...,v,). Seja T a sequência de vetores obtida a partir de 
S por uma das “operações elementares” seguintes: (i) trocar de lugar dois vetores, (ii) multiplicar um vetor 
por um escalar não nulo, (iii) somar um múltiplo de um vetor a um outro vetor. Mostre que S e T geram o 
mesmo espaço W. Também mostre que T é independente se, e só se, S é independente. 


Observe que, em cada operação, os vetores de T são combinações lineares de vetores de S. Por outro lado, cada operação 
tem uma inversa do mesmo tipo (Prove isso!) e, portanto, os vetores de § são combinações lineares de vetores de T. 
Assim, S e T geram o mesmo espaço W. Também, T é independente se, e só se, dim W = n e isso é válido se, e só se, S 
também é independente. 


Sejam A = [a;] e B = [b,] matrizes m x n sobre um corpo K equivalentes por linhas e sejam v, ..., v, vetores 
quaisquer de um espaço vetorial V sobre K. Sejam 

Uy = A1101 F aiU + + AO, wi = bi] + biata ++ by 

Uz = A21 V1 F avo F +° + An Vn wo = ba Y1 + baat +: + banYn 

Um = Am Vi Amava Fº" F Ann Wm = Dm vı + bm202 qosra BDrmnVn 


Mostre que {u;} e (w,) geram o mesmo espaço. 


Aplicar uma “operação elementar” do Problema 4.66 a (u,) equivale a aplicar uma operação elementar com as linhas 
da matriz A. Como A e B são equivalentes por linhas, B pode ser obtida a partir de A por uma sequência de operações 
elementares com as linhas; assim, (w,) pode ser obtido de (u,) pela sequência correspondente de operações. Dessa 
forma, (u,) e (w,) geram o mesmo espaço. 


Sejam w,, ..., v, vetores de um espaço vetorial V sobre K e seja P = [a,] uma matriz quadrada de ordem n 
sobre K. Sejam 


Wi = 4111 + a20 + + Al; Ers Wy = Am Y Fal +: Ha 
(a) Suponha que P seja invertível. Mostre que {w,} e [v,) geral o mesmo espaço; assim, {w,} é independente 
se, e só se, {v;} é independente. 
(b) Suponha que P não seja invertível. Mostre que (w,) é dependente. 
(c) Suponha que {w,} seja independente. Mostre que P é invertível. 


(a) Como P é invertível, é equivalente por linhas à matriz identidade 7. Portanto, pelo Problema 4.67, [w,) e [v,) geram 
o mesmo espaço. Assim, um conjunto é linearmente independente se, e só se, o outro for. 


(b) Como P não é invertível, é equivalente por linhas a uma matriz com alguma linha nula. Isso significa que {w,} gera 
um espaço que tem um conjunto gerador com menos do que n elementos. Assim, {w;} é dependente. 


(c) Essa afirmação é a forma contrapositiva da afirmação (b), portanto, equivale a (b). 


Suponha que A ,, A,, ... sejam conjuntos de vetores linearmente independentes e que A, GA, & . . .. Mostre 
que a união A = A UA, U... também é linearmente dependente. 


Suponha que A seja linearmente dependente. Então existem vetores v, ...,v, EA e escalares a, ...,a, E K, não todos 
nulos, tais que 


av tavy+...tav, =0 (1) 
Como A = U A; e os v, EA, existem conjuntos Å; , . . , A; tais que 
1 n 
v CA;p v, E Ai» natas v, EA; 
Seja k o maior índice dos conjuntos A,, ou seja, k = max(i,,..., i,). Como À, = A, C.. ., segue que cada 4, está 
A J Far n P 
contido em 4,. Logo, v,,u,, . . . , V, EA, e, portanto, por (1), A, é linearmente dependente, contradizendo nossa hipótese. 


Assim, A é linearmente independente. 


Seja K um subcorpo de um corpo L e seja L um subcorpo de um corpo E. (Assim, K C L C E e K é um 
subcorpo de E.) Suponha que E seja de dimensão n sobre L e que L seja de dimensão m sobre K. Mostre que 
E é de dimensão mn sobre K. 
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Suponha que {v,, ..., v,) seja uma base de E sobre L e que {a}, ..., a, ) seja uma base de L sobre K. Afirmamos que (av, 
:i= 1l,...,m,j = 1, ..., n} é uma base de E sobre K. Observe que tag; contém mn elementos. 

Seja w um elemento arbitrário de E. Como {v}, ..., v,) gera E sobre L, w é uma combinação linear dos v, com coeficien- 
tes em L, como segue. 


w = bivi + bau +: + bp Uns b EL (1) 
Como (a,,..., a,) gera L sobre K, cada b; € L é uma combinação linear dos a, com coeficientes em K, como segue. 
bi = ka + kizaz +: + kimam 
b, = kia; + koza + ` +- + komam 
E E E 


com kj € K. Substituindo em (1), obtemos 
w= (kay +++: + kiman) + (kai +: + komam) o + + (kaai +: ata) Yn 
= kyav + + imant + kat +: H komam + H kadi Vn + + kum Am Un 


= 2 kilav;) 
ij 


com k; € K. Assim, w é uma combinação linear dos aw; com coeficientes em Ke, portanto, {av} gera E sobre K. 
A afirmação estará demonstrada assim que provarmos que {av} é linearmente independente sobre K. Suponha que, 


para escalares x; € K, tenhamos >, .x;(a;v;) = 0, ou seja, 


(X11101 F X12430 F+ F Xima) + + (X101 Vh + Xap e + XamAm Um) = 0 
ou 
(Cera + X12843 +: + Ximam) V + oo + (Xna + Xnado + ee + Xmm) Un =0 
Como {v}, ..., v,) é linearmente independente sobre L e os coeficientes dos v, na última expressão pertencem a L, cada 


coeficiente deve ser nulo, ou seja, 


X114] + X12023 + ' + Xmlm = 0, “md Xalal + Xn202 + eee + Xamlm = 0 
Mas {a}, ..., a,,) é linearmente independente sobre K; como x; E K, decorre que 
x =0, 22 =0,..., Xim =0,..., Xm =0, x2=0,...; Xmm = 0 


Dessa forma, {av} é linearmente independente sobre K, provando a afirmação. 


Problemas Complementares 


Espaços vetoriais 


4.71 Suponha que u e v pertençam a um espaço vetorial V. Simplifique as expressões dadas. 
(a) E; = 4(5u — 6v) + 2(3u + v), (c) E, = 6(3u + 2v) + 5u — Tu, 
(b) E, = 5(2u — 3v) +4(7v + 8), (d) E, = 3(5u + 2/v). 


4.72 Seja Vo conjunto dos pares ordenados (a, b) de números reais com adição e multiplicação por escalar definidas por 
(ab)+(cd)=(a+c, b+d) e k(a,b) = (ka,0) 
Mostre que V satisfaz todos os axiomas de espaço vetorial exceto [M,], ou seja, que lu = u. Logo, [M,] não é uma 


consequência dos demais axiomas. 


4.73 Mostre que o Axioma [A,] de um espaço vetorial V (ou seja, que u + v = v + u) pode ser deduzido dos demais axiomas 
de V. 


4.74 Seja Vo conjunto de todos os pares ordenados (a, b) de números reais. Mostre que V não é um espaço vetorial sobre R 
com adição e multiplicação por escalar definidas por 
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G) (ab)+(cd)=(a+d, b+c) e k(a,b) = (ka, kb), 
GD (ab)+(cd)=(a+c, b+d) e k(a,b) = (a,b), 
(iii) (a,b) + (c,d) = (0,0) e k(a,b) = (ka, kb), 

Gv) (a,b)+(c,d) = (ac,bd) e k(a,b) = (ka, kb). 


4.75 Seja Vo conjunto das sequências infinitas (a,, a,, ...) de um corpo K. Mostre que V é um espaço vetorial sobre K com 
adição e multiplicação por escalar definidas por 


(a,a,.. )+(by,b;,.. )=(ay+b, a, + bo, o, e k(aj, az,- ..) = (kaj, kaz...) 
4.76 Sejam U e W espaços vetoriais sobre um corpo K. Seja V o conjunto dos pares ordenados (u, w), com u € U e w € W. 
Mostre que V é um espaço vetorial sobre K com adição e multiplicação por escalar definidas por 
(u,w) + (u, w) =(u+u, w+w) œ k(u, w) = (ku, kw) 


(Esse espaço V é denominado produto cartesiano de U e W.) 


Subespaços 


4.77 Decida se W é, ou não, um subespaço de R?, se W consistir de todos os vetores (a, b, c) de R? tais que (a) a = 3b, (b) 
a<b<c, (Jab=-0, (dda+b+c=0, ()b-a, (f)a=2b=3c. 


4.78 Seja Vo espaço vetorial das matrizes quadradas de ordem n sobre um corpo K. Mostre que W é um subespaço de V se 
W consistir em todas as matrizes A = [a,] que são 
(a) simétricas (A” = A ou aj = a;), (b) triangulares (superiores), (c) diagonais, (d) escalares . 


4.79 Seja AX = B um sistema não homogêneo de equações lineares com n incógnitas, ou seja, B Æ 0. Mostre que o conjunto 
solução não é um subespaço vetorial de K”. 


4.80 Suponha que U e W sejam subespaços de V tais que U U W seja um subespaço. Mostre que U C W ou W CU. 


4.81 Seja Vo espaço vetorial de todas as funções do corpo real R em R. Mostre que W é um subespaço de V se W consis- 
te em todas as (a) funções limitadas, (b) funções pares. [Lembre que f: R — R é limitada se existir M € R tal que 
[f(x)| < M, para cada x € Re que fé parse f (~x) = f(x), Yx € RJ 


4.82 Seja V o espaço vetorial das sequências infinitas (a,, a,, ...) de um corpo K (Problema 4.75). Mostre que W é um su- 
bespaço de V se W consiste em todas as sequências (a) com primeiro elemento a, = 0, (b) com um número finito de 
elementos não nulos. 


Combinações lineares, espaços gerados 


4.83 Considere os vetores u = (1, 2, 3) e v = (2,3, 1) de Rê. 
(a) Escreva w = (1, 3, 8) como uma combinação linear de u e v. 
(b) Escreva w = (2, 4, 5) como uma combinação linear de u e v. 
(c) Encontre k de tal modo que w = (1, k, 4) seja uma combinação linear de u e v. 


(d) Encontre condições sobre a, b, c tais que w = (a, b, c) seja uma combinação linear de u e v. 


4.84 Escreva o polinômio f(t) = a? + bt + c como uma combinação linear dos polinômios pı = (t — 1), p, =t— 1, 
p = 1. [Assim, p,, p, p, geram o espaço P,(t) dos polinômios de grau < 2. 


4.85 Encontre um vetor de R? que gere a interseção de U e W, sendo U o plano xy, ou seja, U = {(a, b, 0)}, e W o espaço 
gerado pelos vetores (1, 1, 1) e (1, 2, 3). 


4.86 Demonstre que ger(S) é a interseção de todos os subespaços de V que contém S. 


4.87 Mostre que ger(S) = ger(S U (0). Ou seja, acrescentando ou retirando o vetor nulo de um conjunto, não modificamos 
o espaço gerado pelo conjunto. 
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4.88 Mostre que (a) se S C T então ger (S) C ger(T). (b) gerl ger(S)] = ger (S) 


Dependência e independência linear 


4.89 Decida se os vetores dados são linearmente dependentes ou independentes. 


(a) (1,2,-3,1), (3,7,1,-2), (1,3,7,—4); (b) (1,3,1,-2), (2,5,-1,3), (1,3,7, —2). 


4.90 Decida se os polinômios u, v, w de P(t) são linearmente dependentes ou independentes. 
(a) u=P-42 +3t+3, v=P +2 +4t-1, w=2P -P —3t+5; 
(b) u=P -5P -—2t+3, v=P -4P -—3t+4, w=2P -17 -Tt+9. 


4.91 Mostre que as funções f, g, h dadas são linearmente independentes. 
(a) f()=e, g(t) =sent, A(t) = É; bd f)=e, glt) =e”, ht) =t. 
4.92 Mostre que u = (a, b) e v = (c, d) de K são linearmente dependentes se, e só se, ad — bc = 0. 


4.93 Sejam u, v, w vetores linearmente independentes. Mostre que os conjuntos S dados são linearmente independentes. 


(a) S=(u+v—-lw, u—v-w, u+w}; (b) S=(u+tv-Iw u+3v-w, v+w}. 


4.94 Suponha que {u}, . . . , Up, W1, : - - , W; } seja um subconjunto linearmente independente de V. Mostre que 
ger (u;) N ger(w;) = {0} 
4.95 Suponha que v,, V, ..., v, sejam linearmente independentes. Mostre que S é linearmente independente nos casos dados. 
(a) S = {a1 01, a302, . . . , „Un } € cada a; Æ O. 
(b) S= (us Uki W, Ukpis -3 Une w = } bivi com by £ O. 
4.96 Suponha que (a,,,..., 41), (051,...,05n), ---; (amis -> Amn) Sejam vetores linearmente independente de K” e su- 


ponha que v,, v, ..., V, sejam vetores linearmente independentes de um espaço vetorial V sobre K. Mostre que os vetores 
dados também são linearmente independentes. 


W =p + F ain Un, Wi = GV + F ava, ee; Wm = Am1 V1 F: + AmnYn 


Base e dimensão 


4.97 Encontre um subconjunto de u,, u», uz, u, que seja uma base de W = ger(u,) em R5, nos casos seguintes. 
(a) u =(1,1,1,2,3), w=(1,2,-1,-2,1), u, =(3,5,-1,-2,5), wu, = (1,2,1,-1,4) 
(b) uw=(1,-2,1,3,-1), w=(-2,4,-2,-6,2), us =(1,-3,1,2,1), wu =(3,-7,3,8,-1) 
(o) uu =(1,0,1,0,1), w =(1,1,2,1,0), us =(2,1,3,1,1), w=(1,2,1,1,1) 
(d) uj; = (1,0,1,1,1), w=(2,1,2,0,1), us=(1,1,2,3,4), wu =(4,2,5,4,6) 


4.98 Considere os subespaçosU = {(a, b,c, d) : b — 2c +d = 0}e W = { (a,b,c,d) : a = d,b = 2c} de Rº. Encontre 
uma base e a dimensão de (a) U, (b) W, (c) U A W. 


4.99 Encontre uma base e a dimensão do espaço solução W de cada um dos sistemas homogêneos dados. 


(a) x+2y-2z+2s— t=0 (b) x+2y— z+3s—4t=0 
x+2y— z+3s-2t=0 2x+4y—-22— s+5t=0 
2x+4y—- + s+ t=0 2x +4y—2z+4s—-2t=0 


4.100 Encontre um sistema homogêneo cujo espaço solução seja gerado pelos conjuntos de três vetores dados. 
(a) (1,-2,0,3,-1), (2,—3,2,5,—3), (1,-2,1,2,-2); 
(b) (1,1,2,1,1), (1,2, 1,4,3), SD, 


JJ  Árcesra Linear 


4.101 Decida se os conjuntos dados são bases do espaço vetorial P (f). 
(a) AL 1+4% 1++2, 14+t+2+4Ê, cs 1+H+P + pele; 
b) {1+6 tË, PHP, cs POEPT, else. 


4.102 Encontre uma base e a dimensão do subespaço W de P(t) gerado por 
(a) u=P +2 -2t+1, v= +3 -3t+4, w=2+ f-Tt+11, 
b) u= +Ê -3t+2, v=2 +Ê +t-4, w=4P +3P -—5t+2. 


4.103 Encontre uma base e a dimensão do subespaço W de M; » gerado por 
1 =5 1 1 
e HR 


Posto de uma matriz, espaços linha e coluna 


[5 a) 2s A] 


4.104 Encontre o posto de cada uma das matrizes dadas. 


13 2 5 4 Ea- qui 1 12 
14 13 5 13 -2 0 4 55 
O Jiga 243P Dlsgog op © 5 81 
23 7-3 6 b3 2 1 -9 -10 -I -2 2 


4.105 Parak = 1,2,..., 5, encontre o número n, de subconjuntos linearmente independentes constituídos de k colunas de cada 
uma das matrizes dadas. 


11023 121072 
(a) A=|1 2 0 2 S] b) B=|1 2304 
13 02.7 1 15 0 6 
121 3 1 6 L2 2 1 2 1 
s 2 4 3 8 3 15 245 4 5 5 
4106 Sjam@A= rá 53 up MSG ga a. 6 
4 8 6 16 7 32 3 6779 10 
e denote por C,, ..., C, suas colunas. Para cada uma das duas matrizes, 


(1) encontre a forma canônica por linhas M; 
(11) encontre as colunas que são combinações lineares das colunas que as antecedem; 
(iii) encontre as colunas (excetuando C,) que formam uma base do espaço coluna; 


(iv) escreva C; como uma combinação linear dos vetores da base encontrada em (iii). 


4.107 Decida se as matrizes dadas têm o mesmo espaço linha. 


1 -2 -1 1 -1 2 so 
- : —4 A s=; 3 el e E E 
4.108 Encontre os subespaços de Rº idênticos dentre os dados. 
U, = gerl(1,1,-1), (2,3,-1), (3,1,-5)), U, = gerl(l,-1,-3), (3,-2,-8), (2,1,-3)] 
U; = ger [(1,1,1), (1,-1,3), (3,-1,7)] 
4.109 Encontre os subespaços de Rf idênticos dentre os dados. 
U, = ger [(1,2,1,4), (2,4,1,5), (3,6,2,9)], U, = ger [(1,2,1,2), (2,4,1,3)), 


U; = ger [(1,2,3,10), (2,4,3,11)] 


4.110 Encontre uma base do (i) espaço linha e do (ii) espaço coluna de cada matriz M dada. 


4.111 


4.112 


4.113 
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(a) M= , ©) M= 


Auno 
NÃO tw O 
o EO 
oO in O m 
ane A 
N U m 
BAN 
a AO mm 
=. Ne oD 
SO q w m 


Mostre que se uma linha qualquer for suprimida de uma matriz em forma escalonada (respectivamente, forma canônica 
por linhas), então a matriz resultante ainda está em forma escalonada (respectivamente, forma canônica por linhas). 


Sejam A e B matrizes m x n quaisquer. Mostre que pos(4 + B) < pos(4) + pos(B). 


Seja r = pos(A + B). Encontre matrizes quadradas A e B de ordem 2 tais que 


(a)r< pos(4), pos(B); (b)r= pos(4) = pos(B); (c)r> pos(4), pos(B). 


Somas, somas diretas, interseções 


4.114 


4.115 


4.116 


4.117 


4.118 


4.119 


4.120 


4.121 


4.122 


Suponha que U e W sejam subespaços bidimensionais de K°. Mostre que U N W £ {0}. 


Suponha que U e W sejam subespaços de V tais que dim U = 4, dim W = 5 e dim V = 7. Encontre as dimensões possí- 
veis de U N W. 


Sejam U e W subespaços de Rº tais que dim U = 1, dim W = 2 e U Z W. Mostre que R? = U & W. 
Considere os subespaços de Rº dados. 


U = ger[(1,-1,-1, -2, 0), (1, -2, -2, 0,3), (1,-1,-2, 2, D] 


W = ger[(1, -2, -3, 0, 2), (1,-1,-3, 2,4), (1,-1,-2,2, -5)] 
(a) Encontre dois sistemas homogêneos cujos espaços solução sejam U e W, respectivamente. 


(b) Encontre uma base e a dimensão de U N W. 


Sejam U,, U,, U, os subespaços de R? dados. 
U =t((a,b,co):a=c), U=t((a,bco):atb+c=0), U, = ((0,0,c)) 
Mostre que (a) R? = U} + U», (b) R? = U, + U3, (c) R? = U, + U}. Quais dessas somas são diretas? 
Suponha que U, W,, W, sejam subespaços de um espaço vetorial V. Mostre que 
(UN W) +(UN M) EC UN(W +m) 
Encontre subespaços de R? para os quais a inclusão é própria. 


Suponha que W,, W,, ..., W, sejam subespaços de um espaço vetorial V. Mostre que 
(a) ger(Wi, MW, sW)=WM+W+--+W,. 
(b) Se S, gera W, comi = 1, ..., r, então S} US U ++- U Sp gera Wi +W,+---+W, 


r 


Suponha que V = U & W. Mostre que dim V = dim U + dim W. 


Sejam S e T subconjuntos (não necessariamente subespaços) arbitrários não vazios de um espaço vetorial V e seja r um 
escalar. A soma $ + Te o múltiplo rS são definidos por 


S+T={u+v:uES, vET}, rS = {ru:u € S} 


[Também escrevemos w + S em vez de {w} + S.] Sejam 


S = {(1, 2), (2, 3)}, T = {(1, 4, (1, 5), (2, 5)}, w = (1, 1), r= 3 


Encontre (a) S + T, (b) w + S, (c) rT, (d) rS + rT, (A AS + T). 
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4.123 Mostre que as operações S + T e rS do problema precedente satisfazem as afirmações dadas. 
(a) Comutatividade: S + T = T + S. 
(b) Associatividade: (8, + S) + S, = S, + (S, + 85). 
(c) Distributividade: (S + T) = rS + rT. 
(d S+[0)=(0)+S=SeS+V=V+S=V. 


4.124 Seja Vo espaço vetorial das matrizes quadradas de ordem n. Seja U o subespaço das matrizes triangulares superiores e 
seja W o subespaço das matrizes triangulares inferiores. Encontre (a) UN W, (b) U + W. 


4.125 Seja Vo produto cartesiano dos espaços vetoriais U e W sobre K (ver Problema 4.76). Sejam 
Û = {(u,0) :u € U} e Ý = {(0,w):w E W} 
Mostre que (a) Û e W são subespaços de V, (b) V = Û p 


4.126 Suponha que V = U+ W. Seja Vo produto cartesiano de U e W. Mostre que V é isomorfo a 4 pela correspondência 
v=u+w + (u,w). 


4.127 Use indução para provar (a) o Teorema 4.22, (b) o Teorema 4.23. 


Coordenadas 


4.128 Os vetores u, = (1, —2) e u, = (4, —7) formam uma base S de R?. Encontre o vetor de coordenadas [v] de v em relação a 
S nos casos (a) v = (5, 3), (b) v = (a, b). 


4.129 Os vetores u, = (1, 2, 0), u, = (1, 3, 2), u, = (0, 1, 3) formam uma base S de Rº, Encontre o vetor de coordenadas [v] de 
v em relação a S nos casos (a) v = (2, 7, —4), (b) v = (a, b, c). 


4.130 S = 1 +P; P + t, t+1, 1Jéuma base de P (1). Encontre o vetor de coordenadas [v] de v em relação a $ nos 


casos (a) v = 2P + Ê — 4t +2, (bD)v-a?+bê+ct+d. 


4.131 Seja V = M; 2. Encontre o vetor de coordenadas [A] de A em relação a S, sendo 


spa Ba e e oah i o afe 


4.132 Encontre a dimensão e uma base do subespaço W de P,(t) gerado por 
u= +2 —3t+4, v=2P +5P —4t +7, w=P +4 +t+2 


4.133 Encontre a dimensão e uma base do subespaço W de M = M, ; gerado por 
1 2 1 2 4 3 1-2 3 
a= iab s=fisob c=[55a 


Problemas variados 


4.134 Responda com verdadeiro ou falso. Se falso, justifique com um contraexemplo. 
(a) Seu, u,, u, geram V, então dim V = 3. 
(b) Se A é uma matriz 4 x 8, então quaisquer seis colunas são linearmente dependentes. 
(c) Seu,, u,, u, são linearmente independentes, então u,, u,, U}, w são linearmente dependentes. 
(d) Seu,, W, Uz, U, são linearmente independentes, então V > 4. 
(e) Seu, u,, Uu, geram V, então w, u, U, us geram V. 


( Seu, u, uz, u, são linearmente independentes, então w,, u,, u, são linearmente independentes. 


4.135 


4.136 


4.137 
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Responda com verdadeiro ou falso. Se falso, justifique com um contraexemplo. 


(a) Se uma coluna qualquer for suprimida de uma matriz em forma escalonada, então a matriz resultante ainda está em 
forma escalonada. 


(b) Se uma coluna qualquer for suprimida de uma matriz em forma canônica por linhas, então a matriz resultante ainda 
está em forma canônica por linhas. 


(c) Se uma coluna qualquer sem pivô for suprimida de uma matriz em forma canônica por linhas, então a matriz 
resultante ainda está em forma canônica por linhas. 


Encontre a dimensão do espaço vetorial W das matrizes quadradas de ordem n dadas. 
(a) matrizes simétricas, (b) matrizes antissimétricas, 


(c) matrizes diagonais, (d) matrizes escalares. 
Sejam £,, h, ..., t, símbolos e K um corpo arbitrário. Seja V o conjunto seguinte de expressões, em que a, € K: 
Mb Halo + + antn 


Defina a soma e multiplicação por escalar em V por 


(atı pasc antn) f (biti meesal batna) = (ay + bit aeeai (AnDam)tn 
katitatb+ taty) = kajti + karty + + kata 


Mostre que, com essas operações, V é um espaço vetorial sobre K. Também mostre que (t,, h, ..., t,} é uma base de V, 
em que 


t = Ot + H Ot 4 +16 +06 ++ 06, 


Respostas dos Problemas Complementares 


[Algumas respostas, tais como bases, não precisam ser únicas.] 


4.71 


4.77 


4.79 


4.83 


4.84 


4.85 


4.89 


4.90 


4.97 


4.98 


4.99 


(a) E, = 26u — 229; (b) A soma 7v + 8 não está definida, portanto, E, não está definida; 


(c) E, = 23u + 5v; (d) A divisão por v não está definida, portanto, E, não está definida. 


(a) É; (b) Não é; por exemplo, (1,2,3) € W, mas —2(1,2,3) g W; 
(c) Não é; por exemplo, (1,0,0),(0,1,0) € W, mas não sua soma; (d) É; 
(e) Não é; por exemplo, (1,1,1) € W, mas 2(1,1,1) É W;(£) É. 


O vetor nulo não é uma solução. 

(a) w = 3u; — u,, (b) Impossível, (c) k = 4, (d) 7a-5b+c=0 
Usando f = xp; + yp + zpy obtemos x = a, y = 2a +b, z =a +b +c. 

v= (2,1,0) 

(a) Dependentes, (b) Independentes 

(a) Independentes, (b) Dependentes 

(a) ur, Uz, Us; (b) u, u2, u3; (C) ui, Uz, Us; (d) u, i, us 
(a) dimU =3, (b) dim W =2, (c) dim(UNW)=1 


(a) Base: ((2,-1,0,0,0), (4,0,1,—1,0), (3,0,1,0, 1)}; dim W = 3; 
(b) Base: {(2,—1,0,0,0), (1,0,1,0,0)}; dim W =2 
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4.100 (a) 5x+y-z-s=0, x+y-z-t=0Q; 
(b) 3x-y-2=0, 2x-3y+s=0, x—2y+t=0 


4.101 (a) É, (b) Não é, porque dim P, (t) = n + 1, mas o conjunto contém somente n elementos. 
4.102 (a) dim W = 2, (b) dim W = 3 
4.103 dim W=2 
4.104 (a) 3, (b) 2, (c)3 
4.105 (a) n =4, m =5, m, =n, =n; = 0; (b) n=4, m=6, m=3, n=n5=0 
4.106 (a) (i) M=[1,2,0,1,0,3; 0,0,1,2,0,1; 0,0,0,0,1,2; OJ; 
(11) C3, C4, Co; (ni) Ci, C3, Cs; (iv) Cs = 3C, + CG; + 2C;. 


(b) (1) M=[1,2,0,0,3,1; 0,0,1,0,—1,—1; 0,0,0,1,1,2; 0]; 
Gi) CG, Cs, Co; (ii) Ci, C3, C4; (Gv) C; = Ci — C +2C, 


4.107 A e C são equivalentes por linhas a | i A a mas B não é. 


0 


a 


4.108 U,e U, são equivalentes por linhas a| À E | mas U, não é. 


4.109 U, e U, são equivalentes por linhas a lo A h 3 


2,1), (0,0,1, 1, —1), (0,0,0,4,7); (11) C}, CG, Cu; 
0,1), (0,0,1,1,2); (11) Ci CG 
413 @ 4=]|! 1f, B= 
i “10 0 
1 0 
o asfi be 


4115 dim(UNW)=2,30u4 


| mas U, não é. 


4.110 (a) © (1, 
1; 


ls 
6 © (1,2,1, 


3 
2, 
—1 1 0 0 2 
a ©) i=l daen o 


—1 
0 
0 0 
01 
3x +4y-z-t=0 4x +2y-s=0, 


4x+2y+s=0 GD orp y+z+t=0 
(b) Base: {(1, —2, —5,0,0), (0,0,1,0, —1)}; dim(U N W) =2 


4.117 (a) © 


4.118 A soma é direta em (b) e (c). 


4.119 Em R?, basta tomar U, V, W, respectivamente, a reta y = x, O eixo xe 0 eixo y. 


4.122 (a) ((2,6), (2,7), (3,7), (3,8), (4,8); O (2,3), 6,4} 
(e e f) ((6,18), (6,21), (9,21), (9,24), (12,24)) 
4.124 (a) Matrizes diagonais, (b) V 


4.128 (a) [-41,11]), (b) [-7a-4b, 2a+b] 


4.129 (a) [-11,13,-10], (b) [c—-3b+7a, c+3b-— 6a, c-—2b+4 4a] 
4.130 (a) [2,-1,-2,2], (b) la, b-c c-b+a, d-c4+b-al 


4.131 (a) [7,-1,-13,10], Œ) [d, c-d, b+c-2d, a-b-2c+24] 
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4.132 dim W = 2; base {} +22 -3t+4, +21). 
4.133 dim W = 2; base {[1,2, 1,3,1,2], 10,0,1,1,3,2]) 


4.134 (a) Falsa; (1, 1), (1,2), (2, 1) geram Rĉ; (b) Verdadeira; 
(c) Falsa; (1, 0, 0, 0), (0, 1,0,0), (0,0, 1,0), w = (0,0,0, 1); 
(d) Verdadeira; (e) Verdadeira; (f) Verdadeira 


1 0 3 
4.135 (a) Verdadeira; (b) Falsa; por exemplo, suprimindo C, de lo 192 | (c) Verdadeira 


4.136 (a) in(n+1), (b) in(n-1), (0) n, (d) 1 


Transformações Lineares 


5.1 INTRODUÇÃO 


O assunto principal da Algebra Linear é o estudo das transformações lineares e suas representações por meio de 
matrizes. Neste capítulo apresentamos essas transformações lineares e, no próximo, mostramos como elas podem 
ser representadas por matrizes. Inicialmente, contudo, apresentamos um estudo de aplicações em geral. 


5.2 APLICAÇÕES, FUNÇÕES 


Sejam A e B dois conjuntos não vazios quaisquer. Suponha que a cada elemento a € A esteja associado um único 
elemento de B, denominado imagem de a. A coleção f dessas associações é denominada aplicação de A em Be é 
denotada por 


f:iASB 


Dizemos que o conjunto A é o domínio da aplicação e que B é o contradomínio. Escrevemos f(a), que é lido “efe de 
a”, para o único elemento de B que f associa ao elemento a € A. 

Podemos também interpretar uma aplicação f : 4 — B como um computador que, para cada valor inicial 
a € A, produz um valor final f (a) € B. 


OBSERVAÇÃO O termo função é um sinônimo da palavra aplicação, embora alguns textos reservem a palavra 
“função” para aplicações de valores reais ou complexos. 


Considere uma aplicação f : 4 — B. Se A’ for um subconjunto qualquer de A, então f(A’) denota o conjunto 
das imagens de todos elementos de A’. Se B’ for um subconjunto qualquer de B, então f FA (B') denota o conjunto 
de todos os elementos de A cujas imagens estão em B. Ou seja, 


HA) = Ma):a cA} e  f'(B')={a€A:f(a)€B'} 


Dizemos que f (4’) é a imagem de 4' e que f7! (B') é a imagem inversa, ou pré-imagem, de B'. Em particular, di- 
zemos que o conjunto de todas as imagens de f, ou seja, fA), é a imagem de f. 

A cada aplicação f : A — B corresponde o subconjunto de 4 x B dado por {(a,f (a)) : a € A}, que é deno- 
minado gráfico de f. Duas aplicações f : A > B e g:A4 — B são definidas como sendo iguais, e escrevemos 
f= g, se fla) = g(a), para cada a € A, ou seja, se possuírem o mesmo gráfico. Assim, não há distinção entre uma 
função e seu gráfico. A negação de f = g é denotada por f + g e significa 


Existe algum a €A para o qual f (a) # g(a). 


As vezes se utiliza a seta especial — para denotar a imagem de um elemento arbitrário x € Æ por uma aplica- 
ção f: 4 — B, escrevendo 


x f(x) 


como no exemplo seguinte. 
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Exemplo 5.1 
(a) Seja f : R — Ra função que a cada número real x associa seu quadrado x”. Podemos escrever essa função 
como segue. 
Jos ou xx 


Aqui, a imagem de -3 é 9, portanto podemos escrever f(-3) = 9. Contudo, f!(9) = (3, —3}. Também 
f(R) =[0,00) = (x: x > 0J é a imagem de f. 


(b) Sejam A = {a, b, c, d} e B = (x,y, z, t}. Uma aplicação f : A — B pode ser definida por 
f(a) =); f(b) =4, f(c) =z, f(d) =y ou f= {(a,y), (b,x), (6,2); (d,y)} 


A primeira definição é explícita e a segunda é dada pelo gráfico. Temos 


Sa, b,d}) = { f(a), f(b) HAD = {xx y} = {x,y} 
Além disso, a imagem de fé AA) = (x,y, z}. 


Exemplo 5.2 Seja V o espaço vetorial dos polinômios sobre R e seja p(t) = 3º — 5t+2. 


(a) A derivada define uma aplicação D : V — V, em que, dado um polinômio f(t) qualquer, temos D( f) = df /dt. 
Assim, 


D(p) =D(3? — 5t +2) = 6t -5 


(b) A integral, digamos, de O a 1, define uma função J : V — R. Ou seja, dado um polinômio f(t) qualquer, 
1 


i= [ro dt, e, portanto,  J(p) = | (32 -51+2)=1 


0 


Observe que a aplicação de (b) é do espaço vetorial V no corpo de escalares R, enquanto a aplicação de (a) é do 
espaço vetorial V nele mesmo. 


Aplicações matriciais 
Seja A uma matriz m x n sobre K. Então A determina uma aplicação F4 : K” — K” por meio de 


F(u) = Au 


em que os vetores de K” e K” estão escritos como colunas. Por exemplo, suponha que 


1 

1 —4 5 —36 

Fi) = Au = |) 3 e 3 -| a 
—5 


OBSERVAÇAO Por conveniência notacional, muitas vezes escrevemos a aplicação F, com a mesma letra A uti- 
lizada para a matriz. 


Composição de aplicações 
Considere duas aplicações f : Á > B e g: B > C, ilustradas a seguir. 


ABC 


GEZI ÁLGEBRA LinEAR 


A composição de fe g, denotada por g ° f, é a aplicação g of: A — C definida por 
(gof)(a) = g(f(a)) 


Isto é, primeiro aplicamos f a a € Ae depois aplicamos g a f (a) € B para obter g( f (a)) € C. Interpretando fe g 
como “computadores”, a composição significa que primeiro utilizamos em fo dado inicial a € 4 para obter a res- 
posta f (a) € B e depois utilizamos em g o dado inicial f(a) para obter a resposta g( f(a)) € C. 

Nosso primeiro teorema diz que a composição de aplicações é associativa. 


Teorema 5.1 Sejam f : ÁA — B, g : B — C, h: C — D. Então 
ho (gof) = (hog) of 
Demonstremos esse teorema. Seja a € 4. Então 


(he (ge/))(a) = Algo f)a)) = hlel la) 
((hog)ef)(a) = (hog) f (a)) = hlg(f(a))) 


Assim, (ho (go f)(a) = ((hog)of)(a), para cada a € A, portanto, ho (gof) = (ho g) of. 
Aplicações injetoras e sobrejetoras 
Introduzimos formalmente alguns tipos especiais de aplicações. 


DEFINIÇÃO Dizemos que uma aplicação f : 4 — B é injetora (ou injetiva) se elementos distintos de A possuem 
imagens distintas, ou seja, 


Se f (a) = f (a'), então a = d'. 


DEFINIÇÃO Dizemos que uma aplicação f : 4 — B é sobrejetora (ou sobrejetiva ou, simplesmente, sobre) se 
cada elemento b € B é a imagem de, pelo menos, um elemento a € 4. 


DEFINIÇÃO Uma aplicação f : 4 — B é denominada bijeção de A em B (ou aplicação bijetora ou bijetiva) se f 
for injetora e, também, sobrejetora. 


Exemplo 5.3 Sejamf:R>R, g:R>R, A:R > R definidas por 


Tie) = 2, g(x) =x =x, h(x) = 2 


Os gráficos dessas funções aparecem na Figura 5-1. A função fé injetora. Geometricamente, isso significa que cada 
reta horizontal não contém mais que um ponto de f. A função g é sobrejetora. Geometricamente, isso significa que 
toda reta horizontal contém pelo menos um ponto de g. A função h não é nem injetora nem sobrejetora. Por exem- 
plo, tanto 2 quanto —2 possuem a mesma imagem 4, e —16 não possui pré-imagem. 


f(x) = 27 glz) = z? — x h(x) = gx? 


Figura 5-1 
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Aplicações identidade e inversa 


Seja A um conjunto não vazio. A aplicação f : A — A definida por f(a) = a, isto é, a função que associa cada ele- 
mento de A a si mesmo, é denominada aplicação identidade e, geralmente, é denotada por 1, ou 1 ou Z. Assim, para 
cada a € 4, temos 1,(a) = a. 

Seja, agora, f : 4 — B. Dizemos que g : B — A é a aplicação inversa de f, denotada por f” | se 


fog=1, e gof =1; 


Enfatizamos que f possui uma inversa se, e só se, f é uma bijeção de A em B, isto é, se f é injetora e sobrejetora 
(Problema 5.7). Além disso, se b € B, então f =l (b) = a, onde a é o único elemento de A para o qual fa) = b. 


5.3 TRANSFORMAÇÕES LINEARES 


Começamos com uma definição. 


DEFINIÇÃO Sejam Ve U espaços vetoriais sobre um mesmo corpo K. Dizemos que uma aplicação F : V — U é 
linear ou, mais precisamente, uma transformação linear, se satisfizer as duas condições seguintes. 


(1) Para quaisquer vetores v, w € V, temos F(v + w) = Fw) + F(w). 
(2) Para quaisquer escalar k e vetor v € V, temos F(kv) = kF(v). 


Assim, F : V — U é linear se “preservar” a soma de vetores e a multiplicação por escalar, as duas operações 
básicas de um espaço vetorial. 

Substituindo k = 0 na condição (2), obtemos F(0) = 0. Assim, qualquer transformação linear leva o vetor nulo 
no vetor nulo. 

Para quaisquer escalares a, b € K e vetores v,w € V, obtemos 


F(av + bw) = F(av) + F(bw) = aF (v) + bF(w) 


De modo mais geral, para quaisquer escalares a, € K e vetores v; € V, obtemos a propriedade básica das transfor- 
mações lineares, como segue. 


Flav + azv ++ aim) = aF (v1) +a F (0) +: + am (Um) 


OBSERVAÇÃO Uma transformação linear F : V — U fica caracterizada completamente pela condição 
F(av + bw) = aF(v) + bF(w) (*) 


portanto, essa condição é, às vezes, utilizada como definição de transformação linear. 


Exemplo 5.4 


(a) Seja F : R? — Rºa aplicação “projeção” sobre o plano xy, isto é, F é a aplicação definida por F(x, y, 2) = (x, 
y, 0). Mostremos que F é linear. Dados v = (a,b,c)ew = (a',b',c”), temos 


F(u+w=F(a+d, b+b, c+c)=(a+d, b+b, 0) 
= (a,b,0) + (d',b,0) = F(v) + F(w) 
e, dado qualquer escalar k, 
F(kv) = F (ka, kb, kc) = (ka, kb,0) = k(a,b,0) = kF (v) 
Assim, F é linear. 


(b) Seja G: R? — R°? a aplicação “translação” definida por G(x, y) = (x + 1, y + 2). [Ou seja, G soma o vetor 
(1,2) a cada vetor v = (x, y) de Rº] Observe que 


G(0) = G(0,0) = (1,2) 4 0 


Assim, o vetor nulo não é levado no vetor nulo. Portanto, G não é linear. 
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Exemplo 5.5 (Aplicações derivada e integral) Considere o espaço vetorial V = P(t) dos polinômios sobre o corpo 
real R. Sejam u(t) e v(t) polinômios quaisquer de V e r um escalar qualquer. 
(a) Seja D: V — V a aplicação derivada. Demonstra-se no Cálculo que 

d(u+v) du dv d(ru) du 


dt dt dt E d "Cd 


Ou seja, D(u + v) = D(u) + D(v) e D(ru) = rD(u). Assim, a aplicação derivada é uma transformação linear. 


(b) Seja J: V — R uma aplicação integral, digamos, 


Também se demonstra no Cálculo que 


| [u(t) + v(t)]dt = | 


0 


1 l 


u(t) dt + | v(t) dt 


0 0 


Ou seja, J(u + v) = J(u) + J(v) e J(ru) = rJ(u). Assim, a aplicação integral é linear. 


Exemplo 5.6 (Aplicações Nula e Identidade) 


(a) Seja F: V — U a aplicação que leva qualquer vetor ve V no vetor nulo 0 € U. Então, dados vetores v,w € V 
quaisquer e um escalar k € K qualquer, temos 


F(v+w =0=0+0=F(v)+F(w) e F(kv) = 0 = k0 = kF (v) 
Assim, F é linear. Dizemos que F é a transformação nula, denotada por 0. 
(b) Considere a aplicação identidade 7 : V — V, que leva cada v € V em si mesmo. Então, dados vetores v, w € V 
quaisquer e escalares a,b € K quaisquer, temos 
I(av + bw) = av + bw = al (v) + bI (w) 
Assim, 7 é linear. Dizemos que 7 é a transformação identidade. 
O próximo teorema (demonstrado no Problema 5.13) fornece uma grande quantidade de exemplos de trans- 


formações lineares. Em particular, diz que uma transformação linear fica completamente determinada pelos seus 
valores nos elementos de alguma base. 


Teorema 5.2 Sejam V e U espaços vetoriais sobre um corpo K. Sejam (v,, v,, ..., v,) uma base de V e 


U, Us, «e, U, vetores quaisquer de U. Então existe uma única transformação linear F: V — U tal que 
F(v) = u, F(v) SU; F (vn) = Up 


Enfatizamos que os vetores u, W, ..., U, nesse teorema são completamente arbitrários, podendo ser linearmen- 
te dependentes ou, até mesmo, todos iguais entre si. 


Matrizes como transformações lineares 


Seja A uma matriz real m x n. Vimos que A determina uma aplicação matricial F4 : K” — K” dada por F, (u) = Au 
(em que os vetores de K” e K” são escritos como colunas). Mostremos que F, é linear. Usando a multiplicação ma- 
tricial, temos 


Fi(vtw)=A(v+w)=A4v+4w=Fy(v)+F,(w) 
F (kv) = A(kv) = k(Av) = kF; (v) 


Em outras palavras, usando A para representar a aplicação matricial, temos 
A(v + w) = Av + Aw e A(kv) = k(Av) 


Assim, A é linear e costumamos dizer que A é uma transformação matricial. 
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Isomorfismo de espaços vetoriais 


A noção de isomorfismo entre dois espaços vetoriais já foi definida no Capítulo 4, quando estudamos as coordena- 
das de um vetor em relação a uma base. Agora revemos esse conceito. 


DEFINIÇÃO Dois espaços vetoriais Ve U sobre K são isomorfos, e escrevemos V = U, se existir uma transfor- 
mação linear bijetora F : V — U. Nesse caso, dizemos que F é um isomorfismo entre Ve U. 


Considere um espaço vetorial V de dimensão n qualquer e seja S uma base qualquer de V. Então a aplicação 


Via lols 


que leva cada vetor v € V em seu vetor de coordenadas [v], é um isomorfismo entre V e K”. 


5.4 NÚCLEO E IMAGEM DE UMA TRANSFORMAÇÃO LINEAR 


Começamos definindo dois conceitos. 


DEFINIÇÃO Seja F: V — U uma transformação linear. O núcleo de F, denotado por Nuc F, é o conjunto de 
todos os elementos de V que são levados no vetor nulo O de U, ou seja, 


Nuc F = {v € V : F(@) = 0} 
A imagem de F, denotada por Im F, é o conjunto dos pontos imagens de U, ou seja, 
Im F = {u € U : existe v € V tal que F(v) = u} 


O teorema abaixo é facilmente demonstrado (Problema 5.22). 


Teorema 5.3 Seja F: V — U uma transformação linear. Então o núcleo de F é um subespaço de V e a imagem 
de F é um subespaço de U. 


Agora suponha que v,, v, ..., v, gerem um espaço vetorial Ve que F: V — U seja uma transformação linear. 


m 


Mostremos que F(v,), F(v,), ..., F(v,) geram Im F. Seja u € Im F. Então existe algum v € V tal que F(v) = u. 


m 


Como os v, geram Ve como v € V, existem escalares a,, a,, ..., a, para os quais 


m 


V = aV] + aV + F AmUm 
Portanto, 
u = F(v) = F(a + azv +... +aUm) — a(o) + asF(v,) +... +apF (vm) 


Assim, os vetores F(v,), F(v,). ..., F(v,) geram Im F. 
Enunciamos esse resultado formalmente. 


Proposição 5.4 Se v, v, ..., v, geram um espaço vetorial Ve F : V — U é uma transformação linear, então 


m 


F(v), Fw), ..., F(v,) geram Im F. 


m 


Exemplo 5.7 


(a) Seja F: R? — R? a projeção de um vetor v sobre o plano xy [conforme Figura 5-2(a)], ou seja, 
Fx, y, z) = x, y, 0) 


Claramente, a imagem de F é todo o plano xy, ou seja, os pontos da forma (x, y, 0). Além disso, o núcleo de F 
é o eixo z, ou seja, 


Im F = {(a, b, c) : c = 0} = plano xy e Nuc F = {(a, b,c): a = 0, b = 0} = eixo z 


(b) Seja G: R? — R? a transformação linear que gira cada vetor v em torno do eixo z por um ângulo 0 [conforme 
Figura 5-2(b)], ou seja, 


GE  Árcesra Linear 


v=(a b, c) 


F(o) = (a, b, 0) y 


(a) 


Figura 5-2 
G(x,»,z) = (xcos 0 — ysen 0, xsenO + ycos0, z) 


Observe que a distância de um vetor v até a origem O não muda com essa rotação, portanto, apenas o vetor nulo 
0 é levado no vetor nulo 0. Assim, Nuc G = {0}. Por outro lado, cada vetor R? é a imagem de um vetor v de R?, 
que pode ser obtido girando u de volta pelo mesmo ângulo 0. Assim, Im G = Rô, todo o espaço. 


Exemplo 5.8 Considere o espaço vetorial V = P(t) dos polinômios sobre o corpo real R e seja H : V — V o ope- 
rador derivada terceira, isto é, H[f(t)] = df /dê. [Às vezes se utiliza a notação D° para H, onde D é o operador 
derivada.) Afirmamos que 


Nuc H = {polinômios de grau < 2) = P,(t) e InH=V 


A primeira afirmação decorre de H(a? + bt + c) = 0, mas H(t") £ 0, para n > 3. A segunda decorre do fato de que 
qualquer polinômio g(t) de V é a derivada terceira de algum polinômio f(t) (que pode ser encontrado tomando a 
antiderivada de g(t) três vezes). 


Núcleo e imagem de transformações matriciais 


Sejam A uma matriz 3 X 4e (e,,e,, €63, e, a base canônica de K’ (escrita como colunas). 


A= bi b, bs b4 , e€ = eq = 


1 
0 
0 
0 


. . ~% . 3 im 
Vimos que A pode ser interpretada como uma transformação linear 4 : K* — K?, em que os vetores de K* e K? são 
considerados vetores colunas. Como a base canônica gera K*, as imagens Ae,, Ae,, Ae,, Ae, geram a imagem de A. 
Mas os vetores Ae,, Ae,, Ae,, Ae, são exatamente as colunas de A, como segue. 

T T T T 
Ae; = [a b1,c1] ] E Aez = lay, by, c4] 


, Ae, = laz, b2, C2 , de; = laz, b3, c3 


Assim, a imagem de A é exatamente o espaço coluna de A. 


Por outro lado, o núcleo de A consiste em todos os vetores v para os quais Av = O. Isso significa que o núcleo 
de A é o espaço solução do sistema homogêneo AX = 0, denominado espaço nulo de A. 
Enunciamos esses resultados formalmente. 


Proposição 5.5 Seja A uma matriz m x n sobre o corpo K interpretada como uma transformação linear 
A : K” — K”. Então 


Nuc A = nul(A) e Im A = col(A) 


Aqui, col(A) denota o espaço coluna de A e nul(A) o espaço nulo de A. 
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Posto e nulidade de uma transformação linear 


Seja F : V — U uma transformação linear. O posto de F é definido como a dimensão da imagem de F e a nulidade 
de F é definida como a dimensão do núcleo de F, ou seja, 


pos(F) = dim(Im F) e nul(F) = dim(Nuc F) 


Vale o teorema seguinte (demonstrado no Problema 5.23). 


Teorema 5.6 Sejam V um espaço de dimensão finita e F : V — U uma transformação linear. Então 
dim V = dim(Nuc F) + dim(Im F) = nul(F) + pos(F) 


Lembramos que o posto de uma matriz A também foi definido como a dimensão dos espaços coluna e linha de 
A. Se, agora, interpretamos A como uma transformação linear, então ambas definições coincidem, pois a imagem 
de A é, precisamente, o espaço coluna de A. 


Exemplo 5.9 Seja F : R$ — R? a transformação linear definida por 


F(xyzt)=(x—-y+z+t, 2x—2y+3z+4t, 3x-— 3y + 4z +51) 


(a) Encontre uma base e a dimensão da imagem de F. 
Primeiro calculamos a imagem dos vetores da base canônica de R4. 


F(1,0,0,0) = (1,2,3), F(0,0,1,0) = (1,3,4) 
F(0,1,0,0) = (—1,-2,-3), F(0,0,0,1) = (1,4,5) 


Pela Proposição 5.4, os vetores imagem geram Im F. Portanto, formamos a matriz M cujas linhas são esses 
vetores imagem e reduzimos M à forma escalonada, como segue. 


1 2 3 La 1 23 
= = =3 000 011 
M= ps A Tal o dO 
1 4 5 02 2 00 0 


Assim, (1, 2, 3) e (0, 1, 1) formam uma base de Im F. Portanto, dim(Im F) = 2 e pos(F) = 2. 


(b) Encontre uma base e a dimensão do núcleo da transformação F. 
Tomamos F(v) = 0, com v = (x, y, z, t), obtendo 


F(x,y,z, t) = (x—-y+z+t, 2x—2y+3z+4t, 3x-— 3y + 4z + 5t) = (0,0,0) 


Igualando os componentes correspondentes, formamos o sistema homogêneo seguinte, cujo espaço solução é 
o núcleo de F. 


o oa y- z+ t=0 x—y+z+ t=0 o e 
2x—2y+3z+4=0 ou 2424=0 o * MD 
3x — 3y +4z+5t=0 z+2t=0 


As variáveis livres são y e t. Portanto, dim(Nuc F) = 2, ou nul(F) = 2. 


(i) Tomando y = 1, t = O obtemos a solução (—1, 1, 0, 0). 
(i) Tomando y = 0, t = 1 obtemos a solução (1, 0, —2, 1). 


Assim (—1, 1, 0, 0) e (1, 0, —2, 1) formam uma base de Nuc F. 


Conforme afirma o Teorema 5.6, temos dim(Im F) + dim(Nuc F) = 4 = dim Rº. 


Aplicações a sistemas de equações lineares 


Seja AX = B a forma matricial de um sistema de m equações lineares com n incógnitas. A matriz A pode ser consi- 
derada como uma transformação linear 


A: K" = K” 


E —————  Árcesra Linear 


Assim, a solução da equação AX = B pode ser interpretada como a pré-imagem do vetor B € K” pela transforma- 
ção linear A. Além disso, o espaço solução do sistema homogêneo associado 


AX =0 


pode ser interpretado como o núcleo da transformação linear A. Aplicando o Teorema 5.6 a esse sistema homogê- 
neo, obtemos 


dim(Nuc A) = dim K” — dim(Im A) = n — pos(A) 


Mas n é exatamente o número de incógnitas do sistema homogêneo AX = 0. Assim, demonstramos o seguinte 
teorema do Capítulo 4. 


Teorema 4.19 A dimensão do espaço solução W de um sistema homogêneo AX = 0 én — r, onde n é o número 
de incógnitas e r é o posto da matriz de coeficientes A. 


Observe que r também é o número de variáveis pivô na forma escalonada de AX = 0, portanto, s = n — r tam- 
bém é o número de variáveis livres. Além disso, são linearmente independentes os s vetores solução de AX = 0 
dados no Teorema 3.14 (Problema 4.52). Dessa forma, como dim W = s, esses vetores formam uma base do espa- 
ço solução W. Assim, demonstramos também o Teorema 3.14. 


5.5 TRANSFORMAÇÕES LINEARES SINGULARES E NÃO 
SINGULARES, ISOMORFISMOS 


Seja F : V — U uma transformação linear. Vimos que, sempre, F(0) = 0. Dizemos que F é singular se a imagem 
de algum vetor não nulo v for 0, isto é, se existir v Æ 0 tal que F(v) = 0. Assim, F : V — U é não singular se o 
vetor nulo O for o único vetor cuja imagem por F é 0; em outras palavras, se Nuc F = (0). 


Exemplo 5.10 Considere a projeção F : R? — R? e a aplicação rotação G : R? > R? representadas na Figura 
5-2. (Ver Exemplo 5.7.) Como o núcleo de F é o eixo z, F é singular. Por outro lado, o núcleo de G é composto 
apenas pelo vetor nulo. Assim, G é não singular. 


Transformações não singulares podem ser também caracterizadas como as transformações que levam conjun- 
tos independentes em conjuntos independentes. Mais precisamente, demonstra-se (Problema 5.28) o teorema se- 
guinte. 


Teorema 5.7 Seja F: V — U uma transformação linear não singular. Então a imagem de qualquer conjunto 
linearmente independente é linearmente independente. 


Isomorfismos 


Suponha que a transformação linear F : V > U seja injetora. Então apenas 0 € V pode ser levado em 0 € U 
e, portanto, F é não singular. A recíproca também é verdadeira. De fato, supondo que F seja não singular e que 
F(v) = F(w), então F(v — w) = F(v) — F(w) = 0 e, portanto, v — w = 0 e v = w. Assim, F(v) = F(w) implica 
v = w, ou seja, F é injetora. Dessa forma, demonstramos a proposição seguinte. 


Proposição 5.8 Uma transformação linear F : V — U é injetora se, e só se, F é não singular. 


Vimos que uma aplicação F : V — U é dita um isomorfismo se F for linear e bijetora, isto é, se F for injetora 
e sobrejetora. Também dizemos que um espaço vetorial V é isomorfo a um espaço vetorial U, e escrevemos V = U, 
se existir um isomorfismo F : V — U. 

Vale o seguinte teorema (demonstrado no Problema 5.29). 


Teorema 5.9 Seja V um espaço vetorial de dimensão finita e suponha que dim V = dim U. Seja F : V — U li- 
near. Então F é um isomorfismo se, e só se, F é não singular. 
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5.6 OPERAÇÕES COM TRANSFORMAÇÕES LINEARES 


Podemos combinar transformações lineares de várias maneiras para obter novas transformações lineares. Essas 
operações são muito importantes e serão utilizadas em todo este texto. 

Sejam F: V — U e G: V — U transformações lineares sobre um corpo K. A soma F + Ge a multiplica- 
ção por escalar kF, com k € K, são definidas como as transformações lineares de V em U dadas por 


(F + G) (v) = F(v) + G(v) e (kF) (v) = kF (v) 
Mostremos, agora, que, se F e G são lineares, então F + G e kF também são lineares. De fato, dados vetores 
v,w €E V e escalares a,b € K quaisquer, temos 
(F + G) (av + bw) = F (av + bw) + G(av + bw) 
= aF(v) + bF(w) + aG(v) + bG(w) 
= alF(v) + G(v)] + blF(w) + G(w)] 
=a(F + G)(v) + b(F + G)(w) 
e (kF)(av + bw) = kF (av + bw) = k[aF (v) + bF(w)] 
= akF (v) + bkF (w) = a(kF)(v) + b(kF)(w) 


Assim, F + Ge kF são lineares. 
Vale o teorema a seguir. 


Teorema 5.10 Sejam Ve U espaços vetoriais sobre um corpo K. Então a coleção de todas as transformações 
lineares de Vem U com as operações de soma e multiplicação por escalar constitui um espaço vetorial sobre K. 


O espaço vetorial das transformações lineares do Teorema 5.10 é geralmente denotado por 
Hom(V, U) 


Aqui, “hom” vem da palavra “homomorfismo”. Enfatizamos que a demonstração do Teorema 5.10 reduz-se a 
demonstrar que Hom(V, U) efetivamente satisfaz os oito axiomas de um espaço vetorial. O elemento nulo de 
Hom(V, U) é a transformação nula de Vem U, denotada por O e definida por 


O(v) = O 


para cada vetor v € V. 
Para espaços vetoriais Ve U de dimensão finita temos o teorema seguinte. 


Teorema 5.11 Se dim V = m e dim U = n, então dim[Hom(V, U)] = mn. 


Composição de transformações lineares 


Sejam, agora, V, U e W espaços vetoriais sobre um mesmo corpo K e sejam F : V — U eG: U — W transforma- 
ções lineares. Podemos visualizar essas transformações como segue. 


ru Si 


Já definimos a função composta G ° F como a aplicação de V em W definida por (G ° F) (v) = G(F(v)). Mostre- 
mos que Go F é linear sempre que F e G forem lineares. De fato, dados vetores v, w € V e escalares a,b € K 
quaisquer, temos 


(Go F)(av + bw) = G(F (av + bw)) = G(aF (v) + bF (w)) 
= aG(F(v)) + bG(F(w)) = a(G° F) (v) + b(G° F)(w) 
Assim, G ° F é linear. 


A composição de transformações lineares e as operações de soma e multiplicação por escalar estão relaciona- 
das como segue. 


G — ÁLGEBRA LINEAR 


Teorema 5.12 Se V, U e W são espaços vetoriais sobre K e 
F:V =U, F': V => U e GU SW, G:U>W 


são transformações lineares, então 


(i) Go(F+F)=GoF+4GoF;, 
(ii) (G+G)oF=GoF+G'oF, 
(iii) k(Go F) = (kG) ° F = Go (kF), com qualquer escalar k € K. 


5.7 A ÁLGEBRA A(V) DOS OPERADORES LINEARES 


Seja V um espaço vetorial sobre um corpo K. Nesta seção consideramos o caso particular das transformações line- 
ares do espaço vetorial V nele mesmo, ou seja, das transformações lineares da forma F : V — V. Essas transfor- 
mações lineares de Vem V são denominadas operadores lineares de V. Escrevemos A(V), em vez de Hom(V, V), 
para o espaço de todos os operadores de V. 

Em particular, A(V) é um espaço vetorial sobre K (Teorema 5.10) e, se dim V = n, então dim A(V) = n’. Além 
disso, dados operadores F, G € A(V), existe a composta G o F, que também pertence a A(V). Dessa forma, temos 
uma “multiplicação” em A(V). [Às vezes, escrevemos GF em vez de G o F no espaço A(V).] 


OBSERVAÇÃO Uma álgebra A sobre um corpo K é um espaço vetorial sobre K no qual está definida uma opera- 
ção de multiplicação que satisfaz, para F, G, H € Ae k € K quaisquer, 


G) F(G +H) = FG +FH, 
(ii) (G + H)F = GF + HF, 
(iii) k(GF) = (kG)F = G(kF) 
Dizemos que uma álgebra é associativa se, além disso, (FG)H = F(GH). 


A definição de álgebra e teoremas precedentes fornecem o resultado seguinte. 


Teorema 5.13 Seja V um espaço vetorial sobre K. Então A(V) é uma álgebra associativa sobre K em relação à 
composição de operadores. Se dim V = n, então dim A(V) = n. 


Por essa razão dizemos que A(V) é a álgebra dos operadores lineares de V. 


Polinômios e operadores lineares 


Observe que a transformação identidade 7 : V — V pertence a A(V). Também, dado qualquer operador linear F em 
A(V), temos FI = IF = F. Podemos, também, definir “potências” de F, como segue. 


F? =], F? =F°F, F?=F°oF=Fo0Fo0F, F= F° oF, 
Além disso, dado qualquer polinômio p(t) sobre K, digamos, 
p(t =a +at +a P Hat 
podemos formar o operador linear p(F), definido por 
p(F) = agl +a, F +a,F? +- H aF" 
(Dado um escalar k qualquer, o operador kI é, às vezes, denotado simplesmente por k.) Em particular, dizemos que 
F é um zero do polinômio p(t) se p(F) = 0. 
Exemplo 5.11 Seja F : K? — K? definido por F(x, y, z) = (0, x, y). Dado qualquer (a, b, c) € K?, temos 


(F +I)(a,b,c) = (0,a,b) + (a,b,c) = (a, a+b, b+c) 
F? (a,b,c) = F? (0,a, b) = F(0,0,a) = (0,0,0) 


Assim, F? = 0, o operador nulo de A(V). Isso significa que F é um zero do polinômio p(t) = A 
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Matrizes quadradas como operadores lineares 


Seja M = M, , 0 espaço vetorial de todas as matrizes quadradas de ordem n sobre K. Então qualquer matriz A em 
M define uma transformação linear F4 : K” — K” por meio de F,(u) = Au (escrevendo os vetores de K” como 
colunas). Como essa transformação é de K” em si mesmo, a matriz quadrada é um operador linear e não apenas 
uma transformação linear. 

Se A e B são matrizes de M, então o produto AB está definido. Além disso, dado qualquer vetor (coluna) u de K”, 


Fas(u) = (AB)u = A(Bu) = A(Fs(U)) = F4 (Fg(u)) = (F1 ° Fg) (u) 


Em outras palavras, o produto matricial AB corresponde à composição de A e B como transformações lineares. 
Analogamente, a soma matricial A + B corresponde à soma de A e B como transformações lineares e a multiplica- 
ção por escalar kA corresponde ao múltiplo escalar de kA de A como uma transformação linear. 


Operadores invertíveis em A(V) 


Seja F : V — V um operador linear. Dizemos que F é invertível se possuir uma inversa, ou seja, se existir F7! em A(V) 
tal que FF! = F-lF = I. Por outro lado, F é invertível como uma aplicação se for injetora e sobre. Nesse caso, a 
aplicação inversa F7! também é linear e é a inversa de F como operador linear (demonstrado no Problema 5.15). 

Suponha que F seja invertível. Então apenas O € V pode ser levado em si mesmo e, portanto, F é não singular. 
A recíproca não é verdadeira, conforme exemplo a seguir. 


Exemplo 5.12 Seja V = P(t) o espaço vetorial dos polinômios sobre K. Seja F o operador de V que aumenta uma 
unidade em cada expoente de t, ou seja, 


F(ag } aıt t at t ARS ł af) =at+a P Hab H Ha tt! 


Então, F é um operador não singular de V. Contudo, F não é sobre, portanto, F não é invertível. 
O espaço vetorial V = P(t) desse exemplo é de dimensão infinita. A situação muda completamente se V tem 
dimensão finita, conforme teorema a seguir. 


Teorema 5.14 Seja F um operador linear de um espaço vetorial V de dimensão finita. Então as quatro condições 
seguintes são equivalentes. 


(1) F é não singular: Nuc F = {0}. (iii) F é uma aplicação sobre. 
(ii) F é uma aplicação injetora. (iv) F é um operador invertível. 


A demonstração desse teorema decorre, essencialmente, do Teorema 5.6, que afirma que 
dim V = dim(Nuc F) + dim(Im F) 
Pela Proposição 5.8, (1) e (ii) são equivalentes. Observe que (iv) é equivalente a (ii) e (iii). Assim, para demonstrar 
o teorema, basta provar que (i) e (iii) são equivalentes, conforme segue. 


(a) Suponha que (i) seja válida. Então dim(Nuc F) = 0, portanto, a equação fornece dim V = dim(Im F), o que signi- 
fica que V = Im F, ou seja, que F é sobrejetora. Assim, (1) implica (iii). 

(b) Suponha que (iii) seja válida. Então V = Im F e, portanto, dim V = dim(Im F). Agora a equação fornece dim(Nuc 
F) = 0 e, portanto, F é não singular. Assim, (iii) implica (i). 


Dessa forma, as quatro condições do teorema são equivalentes. 
OBSERVAÇÃO Suponha que A seja uma matriz quadrada de ordem n sobre K. Então A pode ser vista como 
um operador linear de K". Como K” tem dimensão finita, vale o Teorema 5.14 para a matriz quadrada A. Esse é o 


motivo pelo qual podemos usar os termos “não singular” e “invertível” sem distinção quando aplicados a matrizes 
quadradas. 


Exemplo 5.13 Seja F o operador linear de R? definido por F(x, y) = (2x + y, 3x + 2y). 


(a) Para mostrar que F é invertível, basta mostrar que F é não singular. Tomamos F(x, y) = (0, 0) e obtemos o 
sistema homogêneo 


2x +y=0 e 3x+2y=0 
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Resolvendo em x e y, obtemos x = 0 e y = 0. Logo, F é não singular e, portanto, invertível. 


(b) Para determinar uma fórmula para F-!, tomamos F(x, y) = (s, f) e, portanto, F7! (s, t) = (x, y). Temos 


2x+ y=s 


2x +y, 3x + 2y) = (s,t ou 
(2x +y y) = (s,) E 


Resolvendo x e y em termos de s, t, obtemos x = 2s — te y = —3s + 2t. Assim, 
F! (s,t) = (2s — t, —3s + 2t) ou  F™!(x,y) = (2x— y, —3x + 2y) 


em que reescrevemos a fórmula para F~! usando x e y em vez de s e t. 


Problemas Resolvidos 


Aplicações 


5.1 Decida se os diagramas da Figura 5-3 definem aplicações de A = {a, b, c} em B = {x, y, z}. 
(a) Não. Não há coisa alguma associada ao elemento b € A. 


(b) Não. Os dois elementos x e z estão associados a c € 4. 


(c) Sim. 
Pa > LA 
(PE A f E 
(a) (b) (e) 


Figura 5-3 


5.2 Sejam f: A —B e g: B — C definidas pela Figura 5-4. 
(a) Encontre a aplicação composta (g ° f): A > C. 


(b) Encontre as imagens das aplicações f, g, gof. 


e Sa 


Figura 5-4 


C 


(a) Usando a definição de aplicação composta, calculamos 


(201) (a) =g(f(a)) = 80) =t, (gof) $) =g) =80) =s 
(eef) (c) =8(f(c)) = 80) =t 


Observe que alcançamos o mesmo resultado “seguindo as setas” na Figura 5-4. 


a>y->t, b—>x->s, c5y>t 


5.3 


5.4 


5.5 
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(b) Pela Figura 5-4, os valores da imagem de f são x e y e os valores da imagem de g são r, s, t. Logo, 
Imf= {x,y} e Img = [r,s,t) 
Também, pela parte (a), os valores da imagem da composta g ° f são te s. Logo, Im gof = {s, t}. Observe que as 
imagens de ge g ° f são diferentes. 
Considere a aplicação F : R? — R? definida por F (x,y,z) = (yz, x ). Encontre 
(a) F(2,3,4); (b) F(5,—2,7); (c) F-!(0,0), ou seja, todos v € R° tais que F(v) = 0. 
(a) Substituímos na fórmula de F para obter F (2,3,4) = (3 - 4,2?) = (12,4). 
(b) FO, —2, 7) e = E 7, 2) = (=14,25), 


(c) Tomemos F(v) = 0, com v = (x, y, z) e resolvamos em x, y, Z. 


F(x,y,2) = (2,22) = (0,0) ou yz=0,x =0 


Assim, x = 0 e y = 0, ou z = 0. Em outras palavras, x = 0, y = 0 ou x = 0, z = 0, isto é, o eixo z unido com o eixo y. 


Considere a aplicação F : R? — R? definida por F(x, y) = (3y, 2x). Seja S o círculo unitário de R?, ou seja, 
o conjunto solução de x + y = 1. (a) Descreva F(S); (b) Encontre F = (S). 

(a) Seja (a, b) um elemento de F(S). Então existe algum (x, y) € S tal que F(x, y) = (a, b). Logo, 

b 


(3y, 2x) = (a,b) ou 3y=a,2x=b ou y=92=5 


Como (x,y) € S, ou seja, x? +y? = 1, temos 


Assim, F(S) é uma elipse. 
(b) Seja Fx, y) = (a, b), com (a,b) E€ S. Então (3y, 2x) = (a, b), ou 3y = a, 2x = b. Como (a, b) E S,temosa? + b? = 1 
Assim, (3y)? + (2x) = le, portanto, F7! (S) é a elipse 4x? + 9y? = 1. 


Sejam as aplicações f : Á > B, g : B — C, h: C > D definidas pela Figura 5-5. Decida se cada uma 
dessas aplicações é (a) injetora; (b) sobre; (c) invertível (ou seja, possui inversa). 
(a) A aplicação f : A — B é injetora, pois cada elemento tem uma imagem diferente. A aplicação g : B — C não é 


injetora porque ambos x e z têm a mesma imagem 4. A aplicação h : C — D é injetora. 


(b) A aplicação f : 4 — B não é sobre, porque z € B não é a imagem de elemento algum de A. A aplicação g : B — C 
é sobre, pois cada elemento de C é a imagem de algum elemento de B. A aplicação h: C — D também é 
sobrejetora. 


(c) Uma aplicação tem uma inversa se, e só se, é injetora e sobre. Logo, somente h tem uma inversa. 


Figura 5-5 
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5.6 Sejam f : A > B e g : B — C, portanto, existe(gof): 4 — C. Demonstre. 


5.7 


5.8 


(a) Sefe g são injetoras, então g of é injetora. 

(b) Sefe g são sobrejetoras, então g ° f é sobrejetora. 

(c) Se gof é injetora, então f é injetora. 

(d) Se g of é sobrejetora, então g é sobrejetora. 

(a) Suponha que (g ° f)(x) = (g ° f) (y). Então g( f (x)) = g(f(7)). Como g é injetora, fx) = fy). Como fé injetora, 
x = y. Assim, provamos que (g ° f)(x) = (gºf)(y) implica x = y e, portanto, x = y é injetora. 

(b) Sejac € C. Como g é sobre, existe b € B para o qual g(b) = c. Como f é sobre, existe a € A para o qual f(a) = b. 
Assim, (go f)(a) = g( f (a)) = g(b) = ce, portanto, g of é sobre. 

(c) Suponha que f não seja injetora. Então existem elementos distintos x,y € 4 para os quais f(x) = f(y). Assim, 
(2º0)(0) = g(S0)) = g(f(0)) = (gºf)(y)e, portanto, g o f não é injetora. Isso prova que, se g of é injetora, 
então f necessariamente é injetora. 

(d) Dado a € A, temos (g ° f)(a) = g( f (a)) € g(B). Logo, (gºf)(4) E g(B). Supondo que g não seja sobrejetora, 
g(B) estará contido propriamente em C e, portanto, (g ºf)(A4) estará contido propriamente em C, de modo que g of 
não será sobre. Isso prova que, se g ° f é sobre, então g é sobre. 


Prove que f : 4 — B possui uma inversa se, e só se, f é injetora e sobre. 


Suponha que f possua uma inversa, ou seja, que exista uma função f~! : B — A para a qual f~! of = 14e fof! = 
1,. Como 1, é injetora, f é injetora pelo Problema 5.6(c) e, como 1, é sobre, f é sobre pelo Problema 5.6(d). Assim, f é 
injetora e sobrejetora. 

Agora suponha que f seja injetora e sobrejetora. Então cada b € B é a imagem de um único elemento de A, digamos, b*. 
Assim, se f (a) = b então a = b* logo, f(b*) = b. Seja, agora, g a aplicação de B para A definida por b œ> b*. Temos 
G) (gof)(a) = g(f(a)) = g(b) = b* = a para cada a € Ae, portanto, gof = 14. 

Gi) (fog)(b) =Ff(g(b)) =f(b*) = b para cada b € Be, portanto, fog = 1p. 


Isso mostra que f possui uma inversa, a saber, a aplicação g. 


Seja f : R — R definida por f(x) = 2x — 3. Ocorre que f é injetora e sobre, portanto, possui uma aplicação 
inversa f” 1. Encontre uma fórmula para f~! 

Seja y a imagem de x pela aplicação f, ou seja, y = 2x — 3. Então x é a imagem de y pela aplicação inversa f7! Assim, 
resolvemos essa equação para x em termos de y para obter X = a (y + 3). Então a fórmula que define a função inversa é 
f=) = 1(y+3) ou, usando x em vez de y, f'(x) = 4 (x + 3). 


Transformações lineares 


5.9 


Seja F : R? — R? a aplicação definida por F, y) = (x + y, x). Mostre que F é linear. 


Devemos mostrar que F(v + w) = F(v) + F(w) e que F(kv) = kF(v), onde v e w são elementos quaisquer de Rºekéum 
escalar qualquer. Sejam v = (a, b) e w = (a', b'). Então 


v+w=(a+a, b+b) e kv = (ka, kb) 
Temos F(v) = (a + b, a) e F(w) = (a + b',a'). Assim, 


F(v+w=F(a+a, b+b)=(a+ad +b+b, a+a) 
= (a+b, a) + (ad' +b, d') = F(v) +F(w) 


F(kv) = F(ka, kb) = (ka + kb, ka) = k(a +b, a) = kF (v) 


Como v, w, k são arbitrários, temos que F é linear. 
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5.10 Seja F : R? — R? a aplicação definida por F(x, y, z) = (x + y + z, 2x — 3y + 47). Mostre que F é linear. 
Vamos argumentar com matrizes. Escrevendo vetores como colunas, a aplicação F pode ser escrita na forma F(v) = A 


v, onde v = [x, y, z|” e 


Então, usando propriedades de matrizes, obtemos 


F(v +w) =A(v+ w) = Av + Aw = F(v) + F(w) 


F(kv) = A(kv) = k(Av) = kF (v) 
Assim, F é linear. 


5.11 Mostre que não são lineares as aplicações dadas. 
(a) F: R? > R? definida por F(x,y) = (xy, x). 
(b) F: R? > Rº definida por F(x,y) = (x +3, 2y, x+y). 
(c) F: R? — R? definida por F (x,y,z) = (|x|, y + 2). 
(a) Sejamv = (1, 2) e w = (3, 4). Então v + w = (4, 6), bem como 
F(v) = (1(2),1) = (2,1) e F(w)=(3(4),3)=(12,3) 
Logo, 
F(u +w) = (4(6),4) = (24,6) £ F (v) + F(w) 
(b) Como F(0,0) = (3,0,0) # (0,0,0), F não pode ser linear. 
(c) Sejam v = (1, 2, 3) e k = -3. Então kv = (-3, —6, —9). Temos 
F(v)=(1,5) e kF(v)=-3(1,5)=(-3,-15). 


Assim, 


F(kv) = F(-3,-6,-9) = (3, —15) £ kF (v) 


Por isso, F não é linear. 


5.12 Seja Vo espaço vetorial das matrizes reais quadradas de ordem n. Seja M uma matriz arbitrária fixada de V. 
Seja F : V — V definida por F(A) = AM + MA, para cada matriz A de V. Mostre que F é linear. 


Dadas matrizes A e B de V quaisquer e um escalar k qualquer, temos 
F(A + B) = (A + B)M + M(A + B) = AM + BM + MA + MB 
= (AM + MA) = (BM + MB) = F(A) + F (B) 


F(kA) = (kA)M + M(kA) = k(4M) + k(MA) = k(4M + MA) = kF (4) 


Assim, F é linear. 


5.13 Demonstre o Teorema 5.2. Sejam V e U espaços vetoriais sobre um corpo K. Sejam (v,, v,, ..., v,) uma base 
de Veu,, i, .... 4, vetores quaisquer de U. Então existe uma única transformação linear F : V — U tal que 
F(u) E un, F(u) = Up, lv) = Ma: 


A demonstração será dividida em três etapas. (1) Definimos a aplicação F: V — U de tal modo que 
F(v;) =u; i =1,...,n.(2) Mostramos que F é linear. (3) Mostramos a unicidade de F. 


Passo1 Sejav E€ V. Como (v,, v,,..., v,) é uma base de V, existem escalares únicos a,,...,a, E K para os quais 
v = aV +av +: +a,v, Definimos F : V — U por 


F(v) = aju; + azu +++: + apun 


188 
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5.15 
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(Pela unicidade dos a, a aplicação F está bem definida.) Agora, para i = 1,...,n, 
v=Ov+-+lv+--+O0uv, 
Logo, 
F(v) = 0u, ++ lu, +- + Ou, = u; 


Assim, completamos o primeiro passo da demonstração. 


Passo2 Sejam dados v = a; v; + a3v +: + a, U, e W = biv + bav +-+ + bp Up Então 


v+w = (a; +bi)v + (a, + ba )v +--+ (ap + bp) Un 


e, dado um escalar k € K qualquer, kv = ka; vı + ka,v, +--+ + ka,v,. Pela definição da aplica- 
ção F, 


e F(w) = biu; + bau +--+ b, 


F(v)=autaum+--+a 


Logo, 


= (au Haus - -+ aUn) + (biui + bau +-+bu,) 


F(kv) = klayu + azu ++: + aun) = kF (v) 
Assim, F é linear. 
Passo3 SejaG:V — U uma transformação linear tal que G(v,) = u,i = 1,...,n. Seja 
V = AV + aV F: F Apn 
Então 
G(v) = Glav + azv +--+ a,v) = a G(v) +aG(v,) +- + a, GU) 
=au taum + a,u, = F (0) 


Como G(v) = F(v), para cada v € V, resulta G = F. Assim, F é única e o teorema está demons- 
trado. 


Seja F: R? — R?a transformação linear tal que F(1, 2) = (2, 3) e F(0, 1) = (1, 4). [Observe que {(1, 2), 
(0, 1)} é uma base de R?, de modo que uma tal transformação linear F existe e é única, pelo Teorema 5.2.] 
Encontre uma fórmula para F, ou seja, obtenha F(a, b). 


Escrevemos (a, b) como uma combinação linear de (1, 2) e (0, 1) usando incógnitas x e y. 


(a,b) = x(1,2) + y(0,1) = (x, 2x+y), portanto, a=xb=2x+y 
Resolvemos x e y em termos de a e b, para obter x = a, y = —2a + b. Então 


F(a, b) = xF(1,2) + yF (0,1) = a(2,3) + (—2a + b)(1,4) = (b, —5a + 4b) 


Seja F : V — U uma transformação linear que é injetora e sobre. Mostre que a aplicação inversa F7! : 
U — V também é linear. 


Sejam u, u’ E€ U. Como F é injetora e sobre, existem vetores únicos v, v' € V para os quais F(v) = u e F(v') = w’. 
Como F é linear, também temos 
Flo +)=F()+F(w)=ut+u e F(rv) = rF) = ru 
Pela definição de aplicação inversa, 
F~! (u) =v, F~! (u) =v, F! (u +u) = v + v, F (ru) = ru 
Então 
F(u +u) =v + =F! (u) + F(u’) e Fr) = rv = rF '(u) 


Assim, F~! é linear. 
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Núcleo e imagem de transformações lineares 
5.16 Seja F : R — R? a transformação linear definida por 
F(x,y,z,t) = (x—-y+z+t, x+2z-t, x+y+3z-3t) 
Encontre uma base e a dimensão (a) da imagem de F, (b) do núcleo de F. 
(a) Calculamos as imagens dos vetores da base canônica de R. 
F(1,0,0,0) = (1,1,1), F(0,0,1,0) = (1,2,3) 
F(0,1,0,0) = (—1,0,1),  F(0,0,0,1) = (1,-1,-3) 


Pela Proposição 5.4, os vetores imagem geram Im F. Logo, formamos a matriz cujas linhas são esses vetores ima- 
gem e a reduzimos à forma escalonada. 


1 1l 1 1 1 1 111 
= Ó 0o q 2 012 
1 2 3|] o ı 2]"|000 
Poi 3 0 -2 —4 000 


Assim, (1, 1, 1) e (0, 1, 2) formam uma base de Im F e, portanto, dim(Im F) = 2. 


(b) Tomamos F(v) = 0, com v = (x, y, z, t), ou seja, tomamos 


F(x,y,z, t) = (x-y +z+t, x+2z-—t, x+y+32-3t) = (0,0,0) 


Igualando as entradas correspondentes, obtemos o sistema homogêneo cujo espaço solução é Nuc F. 


x-y+ z+ t=0 x—y+ z+ t=0 
x—-y+z+ t=0 
x +2z— t=0 ou y+ z—2t=0 ou dead 
D 
x+y+3z—-3t=0 2y+2z—4t=0 á 


As variáveis livres são z e t. Logo, dim(Nuc F) = 2. 


(i) Tomando z = —1, t = O obtemos a solução (2, 1, —1, 0). 
(11) Tomando z = 0, t = 1 obtemos a solução (1, 2,0, 1). 


Assim, (2, 1, —1, 0) e (1, 2, 0, 1) formam uma base de Nuc F. 
[Como era de se esperar, dim(Im F) + dim(Nuc F) = 2 + 2 = 4 = dim Rº, o domínio de F. a 


5.17 Seja G : R? — R? a transformação linear definida por 


G(x,y,z) = (x +2y-z, y+z, x+y- 2z) 


Encontre uma base e a dimensão (a) da imagem de G, (b) do núcleo de G. 


(a) Calculamos as imagens dos vetores da base canônica de R?. 
G(1,0,0) = (1,0,1), G(0,1,0) = (2,1,1), G(0,0,1) = (—1, 1, —2) 


Pela Proposição 5.4, os vetores imagem geram Im G. Logo, formamos a matriz M cujas linhas são esses vetores 
imagem e a reduzimos à forma escalonada. 


1 0 1 1 0 1 1 0 1 
“=| 21 IME Í alfo 1 ~| 
=1 1 =2 01 —1 00 0 


Assim, (1,0, 1) e (0, 1, —1) formam uma base de Im G e, portanto, dim(Im G) = 2. 


(b) Tomamos G(v) = 0, com v = (x, y, z), ou seja, tomamos 


G(xyz)=(x+2y-2z, y+z, x+y-—227)=(0,0,0) 
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Igualando as entradas correspondentes, obtemos o sistema homogêneo cujo espaço solução é Nuc G. 


x+2y— z=0 x+2y-z=0 tta 
y+ z=0 ou y+z=0 ou +z=0 
x+ y—-22=0 —y—-z=0 dida 
A única variável livre é z. Logo, dim(Nuc G) = 1. Tomando z = 1, obtemos y = —1 e x = 3. Assim, (3, -1, 


1) forma uma base de Nuc G. [Como era de se esperar, dim(Im G) + dim(Nuc G) = 2 + 1 = 3 = dim R? o 
domínio de G.] 


1 2 3 1 
5.18 Considere a transformação matricial A : Rf > Rê, com A = |1 3 5 —2 | Encontre uma base e a 
3 8 13 =3 


dimensão (a) da imagem de A, (b) do núcleo de A. 


(a) O espaço coluna de A é igual a Im A. Logo, reduzimos 47 à forma escalonada. 


1 1 3 1 1 3 113 

A= 2 3 8 0 1 2 0 1 2 
j3 5 13 0 2 4 0 0 0 

I =2 —3 0 =3 =6 0 0 0 


Assim, ((1, 1, 3), (0, 1, 2)) é uma base de Im A e, portanto, dim(Im A) = 2. 


(b) Sabemos que Nuc A é o espaço solução do sistema homogêneo AX = 0, com X = (x, y, z, 1)”. Logo, reduzimos a 
matriz A de coeficientes à forma escalonada. 


TE e. du x+2y+3z+ t=0 
o0 e lo 1 2 -3 ea 
02 4 -6 000 0 KARER, = 


As variáveis livres são z e t. Logo, dim(Nuc A) = 2. 


(1) Tomando z = 1,t = 0 obtemos a solução (1, —2, 1, 0). 
(11) Tomando z = 0, t = 1 obtemos a solução (—7, 3,0, 1). 


Assim, (1, —2, 1,0) e (-7,3,0, 1) formam uma base de Nuc A. 


5.19 Encontre uma transformação linear F : R? — Rf cuja imagem seja gerada por (1, 2, 0, —4) e (2,0,-1,-3). 


Formamos a matriz 4 x 3 cujas colunas consistem somente nos vetores dados, digamos, 


1 2 2 
2 0 0 
A= O el ai 
a -3 3 


Como A determina uma transformação linear 4: R? — Rº cuja imagem é gerada pelas colunas de A, vemos que a 
transformação matricial A satisfaz o exigido. 


5.20 Suponha que f : V — U seja linear com núcleo W e que f(v) = u. Mostre que a “classe lateral” v + W = 
{v+ w: w € W} éa pré-imagem de u, ou seja, f~! (u) = v + W. 


Precisamos provar que (i) f~! (u) C v+ W e Gi) u+ W Cf! (u). 
Começamos com (i). Seja v! € f7! (u). Então f(v") = u, de modo que 


f- =f) -f)=u-u=0 


ou seja, v' — v € W. Assim, v! = v + (v' — v) € v + W e, portanto, e f~! (u) C v+ W. 


5.21 


5.22 


5.23 
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Agora provamos (ii). Seja v” € v + W. Então v = v + w, com w € W. Como W é o núcleo de f, temos fw) = 0. 
Dessa forma, 


Ho) =fw+w) +f) +f w) =f(0)+0=f(0) =u 
Assim, v' € f7! (u) e, portanto, v + W C f~! (u). 
Essas duas inclusões implicam f~! (u) =v+W. 
Sejam F: V — U e G: U — W lineares. Prove que 
(a) pos(G° F) <pos(G), (b) pos(G ° F) < pos(F) 


(a) Como F(V) CU, também temos G(F(V)) C G(U) e, portanto, dim[G(F(V))] < dim[G(U)]. Então 
pos(G ° F) = dim|(G ° F)(V)] = dim[G(F(V))] < dim[G(U)] = pos(G). 


(b) Temos dim[G(F(V))] < dim[F(V)] Logo, 
pos(Go F) = dim[(Go F)(V)] = dim[G(F(V))] < dim[F(W)] = pos(F) 


Demonstre o Teorema 5.3. Seja F : V — U uma transformação linear. Então 


(a) Im F é um subespaço de U, (b) Nuc F é um subespaço de V. 


(a) Como F(0) = 0, temos 0 € Im F. Sejam, agora,u,u' € Im F e a,b € K. Como u ew pertencem à imagem de 
F, existem vetores v, v’ € V tais que F(v) = ue F(v') = u’. Então 


F(av+bv) = aF (v) +bF(v) =au+bu € Im F 


Assim, a imagem de F é um subespaço de U. 


(b) Como F(0) = 0, temos 0 € Nuc F. Sejam, agora, v,w € Ker F e a, b € K. Como ve w pertencem ao núcleo de 
F, F(v) = 0 e F(w) = 0. Assim, 


F(av + bw) = aF(v) + bF(w) =a0+b0=0+0=0, e,portanto, av + bw € Nuc F 


Assim, o núcleo de F é um subespaço de V. 


Demonstre o Teorema 5.6. Sejam V um espaço de dimensão finita e F : V — U uma transformação linear. 
Então 


dim V = dim(Nuc F) + dim(Im F) = nul(F) + pos(F) 


Suponha que dim(Nuc F) = r, que {w}, ..., w,) seja uma base de Nuc F, que dim(Im F) = s e que {u}, ..., u,} seja uma 
base de Im F. (Pela Proposição 5.4, Im F tem dimensão finita.) Como cada u; E Im F, existem vetores v,, ..., v, de V tais 
que F(v,)) = uj, . . . , F(v,) = uy. Afirmamos que o conjunto 

B = (Wo. Wp, VI. Us} 


é uma base de V, ou seja, que (i) B gera V e (ii) B é linearmente independente. Uma vez demonstrados (i) e (ii), resulta 
que dim V = r + s = dim(Nuc F) + dim(Im F). 


G) B gera V. Seja v € V. Então F(v) € Im F. Como os u; geram Im F, existem escalares a,, ..., a, tais que 
F(v) = aju; +--+ a,u. Denotemosd = av; +---+açv, — v. Então 


F(ô) = Fav +- +a, — v) = aF (v) + +a F(u) — Fw) 


=a +--tau,—F(v)=0 


Assim, à € Nuc F. Como os W; geram Nuc F, existem escalares b,, ..., b, tais que 


ð = biw, + +b,w, = au Heta U U 


Em vista disso, 


v=aw+tav—bw—:—bw, 


Assim, B gera V. 
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(ii) B é linearmente independente. Suponha que 


Xv + tam, Hy + +tyu=0 (1) 
com x;,Y; E€ K. Então 
0 = F(0) = Flw, + + xw, + ii Vs Us) 
=x F(w) dest +x,F(w,) + (v) esse (v) (2) 


Mas F(w) = 0, pois w; E€ Nuc F, € F(v;) = u, Substituindo em (2), obtemos yu, +++ + yçus = 0. Como os u; 
são linearmente independentes, cada y, = 0. Substituindo em (1), obtemos xw; + +- + x,w, = 0. Como os w; 
são linearmente independentes, cada x, = 0. Assim, B é linearmente independente. 


Transformações lineares singulares e não singulares, isomorfismos 


5.24 Decida se a transformação linear dada é não singular. Se não for, encontre um vetor v não nulo cuja imagem 


5.25 


5.26 


seja 0. 
(a) F:Rº? > R? definida por F(x,y) = (x — y, x— 2y), 
(b) G: R? — R?, definida por G(x, y) = (2x — 4y, 3x — 6y). 


(a) Encontramos Nuc F tomando F(v) = 0, com v = (x, y), obtendo 


o o o x= y=0 x—-y=0 
(x—y, x— 2y) = (0,0) ou sl Dad ou pa 
A única solução é x = 0, y = 0. Assim, F é não singular. 
(b) Tomamos G(x, y) = (0, 0) para encontrar Nuc G. 
(2x — 4y, 3x — 6y) = (0,0) ou Ta ou x-2y=0 


O sistema tem soluções não nulas, porque y é uma variável livre. Logo, G é singular. Tomando y = 1, obtemos a 
solução v = (2, 1), que é um vetor não nulo tal que G(v) = 


A transformação linear F : R? — R? definida por F(x,y) = (x — y, x — 2y) é não singular, segundo o 
Problema 5.24 precedente. Encontre uma fórmula para F7! 
Tomando F(x, y) = (a, b), temos F~! (a, b) = (x,y). Calculando, 


x— y=a x-y=a 


(= x—2y) = (a,b) ou x-2y=b 


Resolvendo x e y em termos de a e b, obtemos x = 2a — b, y = a — b. Assim, 

~! (a,b) = (2a — b, a=b) ou F`! (x,y) = (2x —y, x—y) 
(A segunda equação foi obtida substituindo a e b por x e y, respectivamente.) 
Seja G : R? — R? definida por G(x, y) = (x +y, x — 2y, 3x +y). 


(a) Mostre que G é não singular. (b) Encontre uma fórmula para GL 


(a) Tomamos G(x, y) = (0, 0, 0) para encontrar Nuc G. Temos 
(x+y, x— 2y, 3x +y) = (0,0,0) ou x+y=0, x—-2y=0, 3x+y=0 


A única solução é x = 0, y = 0, portanto, G é não singular. 


(b) Embora G seja não singular, não é invertível, porque R? e R? têm dimensões diferentes. (Assim, não podemos 
aplicar o Teorema 5.9.) Em vista disso, não existe Gi 
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Suponha que F : V — U seja linear com V seja de dimensão finita. Mostre que V e a imagem de F têm 
a mesma dimensão se, e só se, F é não singular. Encontre todas as transformações lineares não singulares 
T:R*>Rº 

Pelo Teorema 5.6, dim V = dim(Im F) + dim(Nuc F). Logo, V e Im F têm a mesma dimensão se, e somente se, 
dim(Nuc F) = 0, ou Nuc F = {0} (ou seja, se, e só se, F é não singular). 

Como dim R? é menor do que dim R4, temos que dim(Im T) é menor do que a dimensão do domínio Rº de T. Em vista 
disso, nenhuma transformação linear T : R$ — R? pode ser não singular. 


Demonstre o Teorema 5.7. Seja F : V — U uma transformação linear não singular. Então a imagem de 
qualquer conjunto linearmente independente é linearmente independente. 
Suponha que v,, v, ..., V, Sejam vetores linearmente independentes de V. Afirmamos que F(v,), F(v,), ..., F(v,) também 


são linearmente independentes. Suponha que a,F (v1) + aF (v) +-::+a,F(v,) = 0, coma, € K. Como F é linear, 
F(av+av +:--+a,v,) = 0. Logo, 


av +av +: +açv, E Nuc F 
Mas F é não singular, ou seja, Nuc F = (0). Logo, a} v; + av, ++- + a,v, = 0. Como os v; são linearmente inde- 


pendentes, todos os a, são nulos. Por isso, os F(v,) são linearmente independentes. Assim, demonstramos o teorema. 


Demonstre o Teorema 5.9. Seja V um espaço vetorial de dimensão finita e suponha que dim V = dim U. 
Seja F : V — U linear. Então F é um isomorfismo se, e só se, F é não singular. 


Se F é um isomorfismo, então somente 0 é levado em 0, de modo que F é não singular. Reciprocamente, suponha que F 
seja não singular. Então dim(Nuc F) = 0. Pelo Teorema 5.6, dim V = dim(Nuc F) + dim(Im F). Assim, 


dim U = dim V = dim(Im F) 


Como U tem dimensão finita, Im F = U. Isso significa que F leva V sobre U. Assim, F é injetora e sobre, ou seja, um 
isomorfismo. 


Operações com transformações lineares 
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Defina F : R? — R? eG : R? >RºporF(x,y,7)=(2x, y+z) e G(x,y,27) = (x — z, y). Encontre 
fórmulas que definam as transformações (a) F + G, (b) 3F, (c) 2F — 5G. 
(a) (F + G)(x,y,z) = F (x,y,z) + G(x, y,z) = (2x, y +z) + (x-z, y) = (3x — z, 2y +z) 
(b) (BE)(x,y,z) = 3F (x,y,z) = 3(2x, y +z) = (6x, 3y + 3z) 
(c) (2F o 5G)(x,),2) = 2F (x,y,z) E 5G(x,y,z) = 2(2x, y +z) A S(x -Zz y) 
= (4x, 2y + 2z) + (—5x + 5z, —5y) = (—x + 5z, —3y + 2z) 


Sejam F : R? > R? e G : R? — R? definidas por F (x,y,z) = (2x, y +z) e G(x,y) = (y, x). Deduza 
fórmulas que definam as transformações (a) Go F, (b) F ° G. 


(a) (GoF)(x,y,2) = G(F(x,y,z)) = G(2x, y +z) = (y +z, 2x) 


(b) A aplicação F ° G não está definida, porque a imagem de G não está contida no domínio de F. 


Demonstre. (a) A transformação nula 0, definida por 0 (v) = 0 € U, para cada v € V, é o elemento nulo de 
Hom(V, U). (b) O negativo de F € Hom(V, U) é a transformação (-1)F, ou seja, -F = (-1)F. 


Seja F € Hom(V, U). Então, para cada v € V, 


(a) (F +0)(v) = F(v) + 0(v) = F(v) +0 = F(v) 
Como (F + 0)(v) = F (v), para cada v € V, temos F + 0 = F. Analogamente, 0 + F = F. 
(b) (F + (DE) = F (v) + (~1)F (v) = F(v) — F(x) = 0 = 0(v) 


Logo, F + (-1)F = 0. Analogamente, (—-D)F + F = 0. Assim, -F = (-1)F. 
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5.33 Suponha que F,, F,, ..., F, sejam transformações lineares de V em U. Mostre que, dados escalares a,, a,, ..., 
a, quaisquer e um vetor v € V qualquer, 


(a +, ++ a, Fp) (0) = aFi(v) + aF (0) ++ a, Fp (0) 


A transformação a,F, é definida por (a,F )(v) = a,F (v). Logo, a afirmação é válida para n = 1. Dessa forma, por in- 
dução, obtemos 


(FP, +a,F3 ++ ar )(v) = (a1 F1) (0) + (aF +: + ap Ep) (0) 
= qF; (v) + aF (0) + + aF, (v) 


5.34 Considere as transformações lineares F : R? > R?, G: R? >R?, H: R? — Rº definidas por 
F(x, y,z) = (x+y +z, x+y), G(x, y,z) = (2x +z, x+y), H(x,y,z) = (2y, x) 


Mostre que F, G, H são linearmente independentes [como elementos de Hom(R?, R? J]. 
Dados escalares a, b,c € K, suponha que 


aF + bG + cH =0 (1) 
(Aqui, O é a transformação nula.) Para e, = (1,0,0) € RÌ, temos O(e,) = (0,0) e 
(aF + bG + cH)(e;) = aF(1,0,0) + bG(1,0,0) + cH(1,0,0) 
=a(L,D)+b(2,)+c(0,1)=(a+2b, a+b+c) 
Assim, por (1), (a + 2b, a + b + c) = (0,0) e, portanto, 
a+2b=0 e at+b+c=0 (2) 
Analogamente, para e, = (0,1,0) € Rº, temos O(e,) = (0,0) e 
(aF + bG + cH)(e,) = aF(0,1,0) + bG(0,1,0) + cH(0,1,0) 
=a(LD+b(0,1)+c(2,0)=(a+2c, a+b) 
Assim, 
a+2c=0 e a+b=0 (3) 
Usando (2) e (3), obtemos 
a=0,b=0,c=0 (4) 
Como (1) implica (4), as transformações F, G, H são linearmente independentes. 


5.35 Seja k um escalar não nulo. Mostre que uma transformação linear T é singular se, e só se, kT é singular. Em 
particular, T é singular se, e só se, —T é singular. 


Suponha que T seja singular. Então T(v) = 0, para algum vetor v £ 0. Logo, 
(kD(v) = kT) = k0 = 0 


e, portanto, kT é singular. 
Agora, suponha que kT seja singular. Então (kT)(w) = 0, para algum vetor w Æ 0. Logo, 


T(kw) = kT(w) = (kT)(w) = 0 
Mas, k £ 0e w O implicam kw 0. Assim, T é singular. 


5.36 Encontre a dimensão d de 
(a) Hom(R?, Rf), (b) Hom(Rº,Rº), (c) Hom(P;(t),R?), (d) Hom(M, 3, RÍ). 
Usamos que dim[Hom(V, U)] = mn se dim V = m e dim U = n. 
(a) d= 3(4) = 12. (c) Como dim P, (t) = 4, d = 4(2) = 8. 
(b) d= 568) = 15. (d) Como dim M; ; = 6, d = 6(4) = 24. 
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Demonstre o Teorema 5.11. Se dm V= me dim U = n, então dim[Hom(V, U)] = mn. 


Sejam (v,, ..., v,) uma base de Ve (u,, ..., u,) uma base de U. Pelo Teorema 5.2, cada transformação linear de Hom(V, 
U) fica univocamente determinada associando valores arbitrários de U aos elementos v, da base de V. Definimos 


F; € Hom(V, U), iS Tas JE las 


como sendo a transformação linear dada por F (v) = u, e Fv) = 0, com k + i. Ou seja, F; leva v, em u; e os demais v 
em 0. Observe que (F,) contém exatamente mn elementos. Dessa forma, o teorema estará demonstrado se mostrarmos 
que esse conjunto é uma base de Hom(V, U). 


Demonstremos que(F,) gera Hom(V, U). Considere uma transformação F € Hom(V, U) arbitrária. Sejam F(v,) = w}, 
F(u) = wy, ..., F(v,) = W„ Como w € U, cada w, é uma combinação linear dos u, digamos, 


Wy = aut + au, + + Ala k=1,...,m, aj EK (1) 


Considere a transformação linear G = E Ji a;jF;j. Como G é uma combinação linear dos F, a demonstração de 


que (F,) gera Hom(V, U) termina se mostrarmos que F = G. 
Para isso, calculamos G(v,), para k = 1, ..., m. Como F(v,) = 0, para k £ i, e F(v,) = u, temos 


m n n n 
G(w) = bo X aF (or) = 2 Agile) = 3 At 
j= j= 


= Akuy + dolo F `+: + Ala 


Assim, por (1), G(v,) = w, para cada k. Mas F(v,) = w, para cada k. Em vista disso, pelo Teorema 5.2, F = G. Assim, 
{F} gera Hom(V, U). 
Demonstremos que{F,} é linearmente independente. Considere escalares c;; € K tais que 


Para cada v,, com k = 1, ..., m, 
n 
0= O(v,) = E» 2 cyF y(u) = 2 cyf ylva) = X Cyt; 
=lj 
= Chuy F Cro + `> + Can 


Mas os u, são linearmente independentes, portanto, para k = 1, ..., m, temos Cı = 0,cp = 0, . . . , Cn = O. Em outras 
palavras, todos os c; = 0 e, portanto, (F,) é linearmente independente. 


Demonstre o Teorema 5.12. (1) Go(F+F)=GoF+GoF. (i) (6+6G)cF=GoF+G'oF. 
Gii) k(Go F) = (kG) o F = Go (kF). 
(1) Dadov € V qualquer, 
(Go (F + Fo) = G((F + P)(v)) = G(F (v) + F'(v)) 
= G(F(v)) + G(F'(0)) = (G° F) (v) + (G° Pv) = (G°F + G° F')(0) 

Assim, G° (F + F') = Go F + Go F”. 

(ii) Dado v € V qualquer, 
((G + 6)eM)(0) = (G + )(F(v)) = GE (v)) + C'(F(v)) 
= (Go F)(v) + (G °F) (v) = (GoF + @' ° F)(v) 

Assim, (G + G)0F = GoF+G'oF, 

Gii) Dado v € V qualquer, 
(GS F))(0) = (Go F) (v) = k(G(F())) = (KG)(F()) = (kG° F) (v) 


(Go F)) (0) = k(Go F) (v) = K(G(F (0))) = GKF (0)) = G((KF)(v)) = (G° KF) (0) 
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Por isso, k(Go F) = (kG) ° F = Go (kF). (Enfatizamos que a maneira de demonstrar que duas aplicações são 
iguais consiste em mostrar que cada uma delas associa a mesma imagem a cada ponto do domínio.) 


Álgebra das transformações lineares 
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Sejam Fe G os operadores lineares de R? definidos por F(x, y) = (y, x) e G(x, y) = (0, x). Encontre fórmulas 
que definam os operadores dados. 


()F+6G, (bD2F-36, (JFG, (d) GF, (e) F°, (1) œ. 

(a) (F + 6)(6,3) = F(x,y) + Gy) = (7,2) + (0,2) = (y, 2x). 

(b) (2F — 36)(x,) = 2F(x,7) — 3G(x, y) = 2(y,x) — 3(0,x) = (2y, —x). 

(c) (FG) (6,7) = F(G@,y)) = F(0,x) = (4,0). 

(d (GF) (5,1) = G(F x, y)) = GY, x) = (0,7). 

(e) F2(x,7) = F(F(x,9)) = F(y,x) = (x, y). (Observe que Fº = I, o operador identidade.) 
© G(x,7) = G(G(x,))) = G(0,x) = (0,0). (Observe que G° = 0, o operador nulo.) 


Considere o operador T de Rº definido por T(x, y, z) = (2x, 4x — y, 2x + 3y — z). (a) Mostre que T é inver- 
tível. Encontre fórmula para (b) T7!, (c) T?, (d) T™?. 


(a) Seja W = Nuc T. Basta mostrar que T é não singular (ou seja, que W = {0}.) Tomando T(x, y, z) = (0, 0, 0), 
obtemos 


T(x, y, z) = (2x, 4x — y, 2x + 3y — z) = (0, 0, 0) 
Assim, W é o espaço solução do sistema homogêneo 
2x = 0, 4x—y=0, 2x + 3y-z=0 
cuja única solução é a trivial (0, 0, 0). Logo, W = {0}. Assim, T é não singular e, portanto, invertível. 


(b) Tomemos T(x, y, z) = (r, s, t) [e, portanto, q (r,s, t) = (x,y, z)] Temos 


(2x, 4x — y, 2x + 3y — 2) = (r,s,t) ou 2x=r, 4x-y=s, 2x+3y-z=t 


Resolvendo x, y, z em termos de r, s, t, obtemos X = tr, y=2r—s,z = Tr—3s-— t. Assim, 
1 (r,s,t) = (r, 2r—s, Tr—3s — t) ou T! (x,y,z) = (4x, 2x—y, 7x — 3y- z) 
(c) Aplicamos T duas vezes para obter 
T’ (x,y,z) = T (2x, 4x =y, 2x + 3y =z) 
= [4x, 4(2x) — (4x — y), 22x) + 3(4x — y) — (2x + 3y — 2)] 
= (4x, 4x +y, 14x — 6y +z) 
(d) Aplicamos T7! duas vezes para obter 


T(x yz) =T? Qx, 2x — y, 7x — 3y — z) 
= 26x) -— (2x -y), 7Ġx)-—3(2x-— y) — (7x — 3y - z)] 
= (4x, x+y, Dy 6y +z) 


Sejam V um espaço de dimensão finita e T um operador linear de V para o qual TR = I, para algum operador 
linear R de V. (Dizemos que R é uma inversa à direita de T.) 


(a) Mostre que T é invertível. (b) Mostre que R = 7-1. 


(c) Dê um exemplo mostrando que as afirmações precedentes não valem se V for de dimensão infinita. 
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(a) Seja dim V = n. Pelo Teorema 5.14, T é invertível se, e só se, T é sobre, de modo que é invertível se, e só se, 
pos(7) = n. Temos n = pos(1) = pos(TR) <pos(T) < n. Logo, pos(T) = n e T é invertível. 


b) I7 = TIF = Enio R =R= (TIT)R= T (IR) =T= T4, 


(c) Seja V o espaço dos polinômios em t sobre K, digamos, do tipo p(t) = ay + aıt + at ++ a,t. Sejam Te R 
os operadores de V definidos por 


T(p())=0+a +mt+---+ato! e Rol) =at +a P + a t! 
Temos 
(TR)(p(t) = T(R(p(A)) = Tlat t aP +--+ att) = ao tat tat = plt) 
e, portanto, TR = I, o operador identidade. Por outro lado, se k € K e k Æ 0, então 
(RT)(k) = R(T(k)) = R(0) =0 # k 


Por isso, RT £T. 


Sejam F e G operadores lineares de Rº definidos por F(x, y) = (0, x) e G(x, y) = (x, 0). Mostre que (a) GF 
= 0, o operador nulo, mas FG £ 0. (b) G=6. 


(a) (GF)(x,y) = G(F(x,y)) = G(0,x) = (0,0). Como GF associa O = (0, 0) a cada vetor (x,y) R?, é o operador 
nulo, ou seja, GF = 0. 
Por outro lado, (FG)(x,y) = F(G(x,y)) = F(x,0) = (0,x). Por exemplo, (FG)(2, 3) = (0, 2). Assim, 
FG £0, pois não associa O = (0, 0) a cada vetor de R?. 


(b) Dado qualquer vetor (x, y) em R?, temos G? (x,y) = G(G(x,y)) = G(x,0) = (x,0) = G(x, y). Logo, G = G. 


Encontre as dimensões de (a) A(R?), (b) A(P, (1)), (c) A(M, 3). 


Usamos que dim[A(V)] = nº se dim V = n. Logo, (a) dim[A(R?)] = 4? = 16, (b) dim[A (P, (t))] = 2 = 9, 
(c) dim[A (M; 5)| = 62 = 36. 


Seja E um operador linear de V para o qual E = E. (Tais operadores são denominados idempotentes.) Sejam 
U a imagem e Wo núcleo de E. Prove as afirmações seguintes. 


(a) Seu € U, então E(u) = u (ou seja, E é a transformação identidade em U). 
(b) Se E # I, então E é singular (ou seja, E(v) = 0, para algum v # 0). 
()V=UoW. 
(a) Seu € U, então E(v) = u para algum v € V. Logo, usando E = E, obtemos 

u = E(v) = E’ (v) = E(E(v)) = E(u) 


(b) Se E Æ I, então E(w) = u, para algum v € V, E(v) = u, com v £ u, Por (a), E(u) = u. Assim, 


E(vu-u)=E(v)-E(u)=u-u=0, com v-u#0 
(c) Mostremos que V = U + W. Seja v € V. Tomemos u = E(v) e w = v — E(v). Então 


v = E(v) +v- E(v)=u+w 


Por definição, u = E(v) € U a imagem de E. Agora mostramos que w € W, o núcleo de E, como segue. 
E(w) = E(v — E(v)) = E(v) — E’ (v) = E(v) — E(v) = 0 


Logo, w € W. Assim, V = U + W. 

Agora mostremos que U N W = {0}. Dado v € U N W, temos Ew) = v pela parte (a), pois v E€ U. Como 
v € W, E(v) = 0. Logo, v = Ew) = 0 e, assim, U N W = {0}. 
As duas propriedades demonstradas implicam que V = U & W. 


G]  Árcesra Lincar 


Problemas Complementares 


Aplicações 


5.45 


5.46 


5.47 


5.48 


Encontre o número de aplicações diferentes de (a) (1,2) em {1, 2, 3}, (b) (1,2, ..., r} em {1, 2, ..., S}. 


Sejam f:R > Reg: R > R definidas por f(x) = x? + 3x + le g(x) = 2x — 3. Encontre fórmulas que definam as 
aplicações compostas (a) fog; (b)gof; (© geg; (Dfof. 


Para cada aplicação f : R — R, encontre uma fórmula para a inversa. (a) f(x) = 3x — 7, (b) f(x) = x? + 2. 


Dada qualquer aplicação f : A — B, mostre que lp of =f =fol,. 


Transformações lineares 


5.49 


5.50 


5.51 


5.52 


5.53 


5.54 


5.55 


5.56 


5.57 


5.58 


5.59 


5.60 


Mostre que são lineares as aplicações dadas. 


(a) F:Rº — R? definida por F (x,y,z) = (x + 2y — 3z, 4x — 5y + 67). 
(b) F:Rº? > R° definida por F(x,y) = (ax + by, cx + dy), coma, b, c, d escalares reais. 


Mostre que não são lineares as aplicações dadas. 


(a) F:Rº? > R? definida por F(x,y) = : y: 

(b) F:Rº > R? definida por F (x,y,z) = (x+ 1, y +z). 
(c) F: R? — R? definida por F(x,y) = E: y). 

(d) F: R? > R? definida por F (x,y,z) = (|x|, y + 2). 


Encontre F(a, b) se a transformação linear F : R? — R? é definida por F(1, 2) = (3, —1) e F(0, 1) = (2, 1). 


Encontre uma matriz 2 x 2 A que leve 


(a) (1,3) e(1,4) em (-2, 5)" e (3, 1)”, respectivamente. 
b) (2, —4)" e(-1,2) em (1, 1)” e(1,3)”, respectivamente. 


Encontre uma matriz singular 2 x 2 B que leve (1, 1)” em(1, 3)”. 


Seja V o espaço vetorial de todas as matrizes reais quadradas de ordem n e seja M uma matriz não nula de V fixada. 
Mostre que as duas primeiras aplicações dadas são lineares, mas não a terceira. (a) T(A) = MA, (b) T(A) = AM + MA, 
OTA) =M +A. 


Dê um exemplo de uma aplicação não linear F : R? — R? tal que F7! (0) = {0} mas F não é injetora. 


Sejam F : R? — R? definida por F(x,y) = (3x + 5y, 2x + 3y) e S o círculo unitário de R’. (S consiste nos pontos 
satisfazendo x? + y? = 1.) Encontre (a) a imagem F(S), (b) a pré-imagem F al (S). 


Considere a transformação linear G : R? — Rº definida por G(x, y,z) = (x +y +z, y— 2z, y— 3z) e a esfera uni- 


tária S, em Rê, que consiste nos pontos satisfazendo x? + y? + 2? = 1. Encontre (a) G(S3), (b) G7! (S3). 


Seja Ho plano x + 2y — 3z = 4 de R? e seja G a transformação linear do Problema 5.57. Encontre (a) G(H), (b) G7! (H). 


Seja W um subespaço de V. A aplicação inclusão i: W — V é definida por i(w) = w, para cada w € W. Mostre que a 
inclusão é linear. 


Seja F : V — U uma transformação linear. Mostre que F(~v) = -F (v). 
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Núcleo e imagem de transformações lineares 


5.61 


5.62 


5.63 


5.64 


5.65 


5.66 


5.67 


5.68 


5.69 


Para cada uma das transformações lineares F dadas, encontre uma base e a dimensão do núcleo e da imagem de F. 


(a) F:Rº > R? definida por F (x,y,z) = (x + 2y — 3z, 2x + 5y — 4z, x +4y +z), 
(b) F:Rº > R? definida por F (x,y,z, t) = (x + 2y +3z + 2t, 2x +4y +7z+ 5t, x+ 2y + 6z + 5t). 


Para cada uma das transformações lineares G dadas, encontre uma base e a dimensão do núcleo e da imagem de G. 
(a) G: Rê — R? definida por G(x, y, z) = (x +y +z, 2x + 2y + 2z), 

(b) G: R? — R? definida por G(x, y, z) = (x +y, y +z), 

(© G: R? — R? definida por 


G(x, y,Zz, s, t) = (x+ 2y +2z+s+t, x+2y+3z+2s-t, 3x+ 6y + 8z+5s-—t). 


Cada uma das matrizes seguintes determina uma transformação linear de Rf em RÌ. 


1 20 1 10 2 si 
() 4=|/2 121,6) B=| 23 -1 ı 
| =x a = = 8 


Encontre uma base, bem como a dimensão, do núcleo e da imagem de cada transformação linear. 


Encontre uma transformação linear F : R? — R? cuja imagem seja gerada por (1, 2, 3) e (4,5, 6). 
Encontre uma transformação linear G : Ri — R? cujo núcleo seja gerado por (1, 2, 3, 4) e (0, 1, 1, 1). 


Seja V = P (^) o espaço vetorial dos polinômios de grau < 10. Considere a transformação linear D':V > V, onde D' 
denota a derivada quarta d*( A) dtt. Encontre uma base e a dimensão (a) da imagem de D': (b) do núcleo de D”. 


Suponha que F : V — U seja linear. Mostre que (a) a imagem de qualquer subespaço de V é um subespaço de U; (b) a 
pré-imagem de qualquer subespaço de U é um subespaço de V. 


Mostre que, se F : V — U é sobre, então dim U < dim V. Encontre todas as transformações lineares F : R? — Rf que 
são sobre. 


Considere a transformação nula 0: V — U definida por O(v) = 0, para cada v de V. Encontre o núcleo e a imagem de 0. 


Operações com transformações lineares 


5.70 


5.71 


5.72 


5.73 


5.74 


Sejam F : R? > R? eG: R? — R? definidas por F (x,y,z) = (y, x +z)e G(x,y,2) = (2z, x — y). Encontre fórmu- 
las que definam as transformações F + G e 3F — 2G. 


Seja H : R? — R?definidapor H (x, y) = (y, 2x). Usandoastransformações lineares Fe Gdo Problema5.70, encontrefórmu- 
las que definam as transformações (a) HoF e HoG, (b)FoH e GcoH, ()Ho(F+G) e HoF+HoG. 


Mostre que as transformações lineares F, G, H dadas são linearmente independentes. 


(a) F,G,H € Hom(R?, R?) definidas por F(x,y) = (1,27), G(x,y) = (y, x+y), H(x,y) = (0,2). 
(b) F,G,H € Hom(R?, R) definidas por F(x, y,z) =x +y +z, G(x,y,z) =y+z, H(x,y,z) =x-z. 


Dadas F, G € Hom(V, U), mostre que pos(F + G) < pos(F) + pos(G). (Aqui, V tem dimensão finita.) 


Sejam F : V — U e G: U — V lineares. Mostre que, se F e G são não singulares, então G ° F é não singular. Dê um 
exemplo em que G ° F é não singular, mas G não é. [Sugestão: considere dim V < dim U.] 
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5.75 


5.76 


5.77 


Encontre a dimensão d de (a) Hom(R?, RË), (b) Hom(P,(t), R°), (c) Hom(M, 4, P>(t)). 


Decida se a transformação linear dada é não singular. Se não for, encontre um vetor não nulo v cuja imagem seja 0; caso 
contrário, encontre uma fórmula para a transformação inversa. 


(a) F:Rº > R? definida por F(x,y,2) = (x+y +z, 2x+3y+5z, x+3y+ 77), 
(b) G: R? — P,(t) definida por G(x, y, z) = (x +y)Ê + (x + 2y + 2z)t +y +z, 
(c) H: R? > P,(t) definida por H (x,y) = (x + 2y)Ê + (x — yt +x +y. 


Quando ocorre dim[Hom(V, U)] = dim V? 


Álgebra dos operadores lineares 


5.78 


5.79 


5.80 


5.81 


5.82 


5.83 


Sejam F e G os operadores lineares de R? definidos por F(x, y) = (x + y, 0) e G(x, y) = (=y, x). Encontre as fórmulas 
que definem os operadores lineares (a) F + G, (b) 5F — 3G, (c) FG, (d) GF, (e) F, (ft) C. 


Mostre que cada operador linear T de R? dado é não singular e encontre uma fórmula para 7-1. 
(a) T(x, y) =(x + 292% + 39), (b) T(x,9) = (2x — 3y, 3x — 4y). 


Mostre que cada um dos operadores lineares T de Rº dados é não singular e encontre uma fórmula para T7! 
(a) T(x, y,z) = (x = 3y — 2z, y—42, z); (b) T(x,y,z) = (x +z, x= y, y). 


Encontre a dimensão de A(V), nos casos (a) V = R7, (b) V = P; (t), (c) V = M; 4. 
Quais dos inteiros dados pode ser a dimensão de uma álgebra A(V) de operadores? 5, 9,12, 25, 28, 36, 45, 64, 88, 100. 


Seja T o operador linear de R? definido por T (x,y) = (x + 2y, 3x + 4y). Encontre uma fórmula para f(T), nos casos 
dados. (a) f(t) =P + 2t- 3, (b) f(t) = Ê — 5t — 2. 


Problemas variados 


5.84 


5.85 


5.86 


5.87 


5.88 


5.89 


Sejam F : V — U linear e k um escalar não nulo. Prove que as transformações F e kF têm o mesmo núcleo e a mesma 
imagem. 


Sejam F e G operadores lineares de V. Suponha que F seja não singular e que a dimensão de V seja finita. Mostre que 
pos(FG) = pos (GF) = pos(G). 


Sejam V um espaço de dimensão finita e T um operador linear de V tal que pos(T°) = pos(T). Mostre que 
Nuc TN Im T = {0}. 


Suponha que V = U W. Sejam E, e E, os operadores lineares de V definidos por E,(v) = u, Ex(v) = w, com 
v=u + w,u € U, w€ W. Mostre que (a) E? =E; e Æ} = E, (ou seja, E, e E, são projeções); (b) E, + E, = I, 
o operador identidade; (c) EE, = 0 e EE, = 0. 


Sejam E, e E, operadores lineares de V quaisquer que satisfazem as condições (a), (b) e (c) do Problema 5.87. Prove que 
V = Im E, O Im E 


Sejam v e w elementos de um espaço vetorial real V. O segmento de reta L de v a v + w é definido como o conjunto de 
vetores v + tw, com O < t < 1. (Ver Figura 5-6.) 


(a) Mostre que o segmento de reta L entre os vetores v e u consiste nos pontos 


G) (1 — t)v + tu,com0 < t < 1, (ii) tiv + hu, comt +Hh=1,4>0,h2>0. 
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(b) Seja F : V — U linear. Mostre que a imagem F(L) de um segmento de reta L de V é um segmento de reta de U. 


v+w 


Figura 5-6 


5.90 Seja F:V — U linear e W um subespaço de V. A restrição de F a W é a aplicação F|W : W — U definida por 
F|W (v) = F(v), para cada v de W. Prove que 


(a) F|W é linear; (b) Nuc (F|W) = (Nuc F) N W; (c) Im (F|W) = F(W). 


5.91 Um subconjunto X de um espaço vetorial V é dito convexo se o segmento de reta entre dois pontos (vetores) P, Q € X 
quaisquer estiver contido em X. (a) Mostre que a interseção de conjuntos convexos é um conjunto convexo; (b) Suponha 
que F:V — U seja linear e X convexo. Mostre que F(X) é convexo. 


Respostas dos Problemas Complementares 


5.45 (a) 3? = 9, (b) s” 


5.46 (a) (fog)(x) = 42 +1, (b) (gof)(x) = 222 +6x-1, (c) (go g)(x) = 4x —9, 
(d) (Sof) =x! + 6º + 142 + 15x +5 


547 DI) =3(047), OS) =VA—2 


5.49 F(x,y,z) = A(x, y, z)", com (a) 4 = p E a (b) 4= f ] 


5.50 (a) u = (2, 2), r = 3; então F(ru) = (36, 36), mas rF(u) = (12, 12); (b) F (0) # 0; 


(c) u = (1,2), v = (3, 4); então F(u + v) = (24, 6), mas F(u) + Fw) = (14, 6); 
(d) u = (1,2, 3), r = —2; então F(ru) = (2, —10), mas rF(u) = (-2, -10). 


5.51 F(a,b) = (—a + 2b, —3a + b) 


—17 5 


5.52 (a) A = | A 


| (b) Não existe. (2, —4) e (1, 2) são linearmente dependentes, mas (1, 1) e (1, 3) não são. 


5.53 B= É J [Sugestão: levar (0, 1)” em (0,0)”.)] 


5.55 F(x,y) = (x,y) 


5.56 (a) 13x? — 42xy + 34y? = 1, (b) 13x? + 42xy + 34y? = 1 
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5.57 (a) x? — 8xy + 26y? + 6xz — 38yz + 1472 = 1, (b) x? + 2xy + 3y? + 2xz — 8yz + 142 = 1 


5.58 (a) x — y + 2z = 4, (b) x + 6z = 4 


5.61 (a) dim(Nuc F) = 1, ((7,-2, 1)}; dim(Im F) = 2, {(1,2,1), (0,1,2)}; 
(b) dim(Nuc F) = 2, {(—2,1,0,0), (1,0,—1,1)}; dim(Im F) = 2, {(1,2,1), (0,1,3)} 


5.62 (a) dim(NucG) = 2, {(1,0,—1), (1,—1,0)}; dim(Im G) = 1, {(1,2)}; 
(b) dim(NucG) = 1, {(1,—1,1)}; Im G = R?, {(1,0), (0, 1)}; 
(c) dim(NucG) = 3, {(—2, 1,0,0,0), (1,0,—1,1,0), (—5,0,2,0,1)}; dim(Im G) = 2, 
{L3 (0,1,2)} 
5.63 (a) dim(Nuc 4) = 2, ((4,-2,-5,0), (1,—3,0,5)}; dim(Im 4) = 2, ((1,2,1), (0,1,1)}; 
(b) dim(Nuc B) = 1, {(—1,4,1,1)}; Im B = R? 


5.64 F(x,y,z) = (x + 4y, 2x + 5y, 3x + 6y) 


5.65 F(x,y,z,t) = (x +y-z, 2x+y-t,0) 

5.66 (a) {1,t, P, ...,t6}, (b) (62,0) 

5.68 Não há, porque dim R4 > dim R. 

5.69 NucO = V, Im O = (0) 

5.70 (F + G)(x,y,z) = (p+27, 2x—y+2), (3F — 2G)(x,y,z) = (3y — 4z, x + 2y + 3z) 


5.71 (a) (H° F)(x,y,z) = (x +z, 2y), (H° G)(x,y,z) = (x — y, 4z); (b) não está definida; 
(0) (H° (F + G))(x,y,z) = (H° F + H° G) (x,y,z) = (2x -y +z, 2y + 4z) 


5.74 F(x,y) = (x,y, y), G(x, y,z) = (x,y) 
5.75 (a) 16, (b) 15, (c) 24 


5.76 (a) v = (2, —3,1); (b) Ga? +bt+c)=(b—2c, a-b+2, a+b-c); 


(c) H é não singular, mas não invertível, porque P, (t) > dim R°. 
5.77 Se dim U = 1, ou seja, se U = K. 


5.78 (a) (F + G)(x,y) = (x,x); (b) (5F — 3G) (x,y) = (5x + 8y, —3x); (c) (FG) (x,y) = (x — », 0); 


(d) (GF)(x,y) = (0, x+y); (e) F”(x,y)=(Œ~+y, 0)(observe que F? = F); (8 (x,y) = (=x, =y). 
[Observe que G? + 1 = 0, portanto, G é um zero de f(t) = 2 + 1] 


5.79 (a) T! (x,y) = (—3x + 2y, 2x— y), (b) T=! (x,y) = (—4x + 3y, —3x + 2y) 


5.80 (a) T(x, y, z) = (x + 3y + 14z, y — 4z, z), (b) T! (x,y,z) = © +z, y, x-y- z) 
5.81 (a) 49, (b) 36, (c) 144 


5.82 Os quadrados: 9, 25, 36, 64 e 100 


5.83 (a) T(x, y) = (6x + 14y, 21x + 27y); (b) T(x,y) = (0,0), ou seja, HT) = O 


Capítulo 6 


Transformações 
Lineares e Matrizes 


6.1 INTRODUÇÃO 


Considere uma base S = {u}, t, ..., 4,) de um espaço vetorial V sobre um corpo K. Dado um vetor v € V qualquer, 
digamos que 


V = aqui + ayuy +`: F apun 


Então o vetor de coordenadas de v em relação à base S, que interpretamos como um vetor coluna (salvo menção 
explícita em contrário), é denotado e definido por 
T 

[vls = [a,, a, Eao sa 
Na Seção 4.11 vimos que a aplicação v— [v] ç, determinada pela base S, é um isomorfismo entre V e K”. 

Neste capítulo mostramos que também existe um isomorfismo, determinado pela base S, entre a álgebra A(V) 
dos operadores lineares de V e a álgebra M das matrizes quadradas de ordem n sobre K. Assim, a cada operador 
linear F: V — V corresponde a uma matriz quadrada [F]; de ordem n determinada pela base S. Também veremos 
como nossa representação matricial varia quando escolhemos alguma outra base. 


6.2 REPRESENTAÇÃO MATRICIAL DE UM OPERADOR LINEAR 


Seja T um operador linear de um espaço vetorial V nele mesmo e suponha que S = (u,, u,, ..., U„} seja uma base de 
V. Agora T(u,), T(u,), ..., T(u,) são vetores de V, portanto, cada um é uma combinação linear dos vetores da base S, 
digamos 


T(u) = au, + au ++ au, 
T(u,) = axquy + doou, + ` +° + doam 
T(u,) = GU, T dous qeria Annn 


Convém apresentar a definição seguinte. 


DEFINIÇÃO A transposta da matriz de coeficientes [a;], denotada por m(T) ou [T],, é denominada representação 
matricial de T em relação à base S ou, simplesmente, matriz de T na base S. (O índice S pode ser omitido se sou- 
bermos qual é a base S.) 

Usando a notação de vetores de coordenadas (colunas), a representação matricial de T pode ser escrita na forma 


ms(T) = [Ts = [T (u )]s [T (u)]s sad [T (u, Is] 


Assim, as colunas de m(T) são, respectivamente, os vetores de coordenadas de T(u,), T(u,), ..., T(u,). 


EZ ÁLGEBRA Linear 


Exemplo 6.1 Seja F: R? —> R?o operador linear definido por F(x, y) = (2x + 3y, 4x — 5y). 


(a) Encontre a representação matricial de F em relação à base S = (m,,u,+ = ((1,2), (2,5)+. 
(1) Primeiro calculamos F(u,) e então escrevemos esse vetor como uma combinação linear dos vetores da 
base u, e u,. (Por conveniência notacional, utilizamos vetores coluna.) Temos 


noi + amos 


Resolvendo o sistema, obtemos x = 52 e y = —22. Logo, F(u,) = 52u, — 22u,. 


(2) Em seguida calculamos F(u,) e então escrevemos esse vetor como uma combinação linear de u, e u. 
Temos 


ro (E e e 


Resolvendo o sistema, obtemos x = 129 e y = —55. Logo, F(u,) = 129u, — 55u,. 
Agora escrevemos as coordenadas de F(u,) e F(u,) como colunas para obter a matriz 


is = | 52 Es 


=22 =55 


(b) Encontre a representação matricial de F em relação à base canônica E = (e,, e,) = ((1,0), (0, 1)). 
Encontramos F(e,) e escrevemos esse vetor como uma combinação linear dos vetores e, e e, da base ca- 
nônica e, depois, encontramos F(e,) e escrevemos esse vetor como uma combinação linear de e, e e,. Temos 


Fejs o= =%4de; 
1 


1 
F(e,) = F(0, 1) = (3, —5) = 3e; — 5e, 


e, portanto, is = [á | 


Observe que as coordenadas de F(e,) e F(e,) formam as colunas, e não as linhas, de [F],. Observe, também, 
. NE Š . ` . a AU: 2 
que a aritmética é muito mais simples utilizando a base canônica de R°. 


Exemplo 6.2 Seja Vo espaço vetorial das funções, de base S = {sen t, cos t, e”) e seja D: V — V o operador 
diferencial definido por DAA) = d(f(t))/dt. Calculemos a representação matricial de D na base S. 


D(sent) = cost= O(sent) + I(cost) + 0(et) 
D(cos t) = — sent = —1 (sen t) + O(cost) + 0(e%) 
D(e) = 3e” = O(sent) + O(cost) + 3(e”) 


e, portanto, [D] = 


Observe que as coordenadas de D(sen 1), D(cos t) e D(e”) são as colunas, não as linhas, de [D]. 


Transformações matriciais e suas representações matriciais 


. . . . . 2 2 
Considere a matriz A dada a seguir, que pode ser vista como um operador linear de R',e a base S de R'. 


a=; E e s= (uu) = [2 [5]) 


(Escrevemos os vetores como colunas, porque nossa aplicação é matricial.) Encontremos a representação matricial 
de A em relação à base S. 
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(1) Primeiro escrevemos A(u,) como uma combinação linear de u, e u,. Temos 


e E O RR Ro RR 2 x+2y=-—1 
sop [= [8] =] e arg 
Resolvendo o sistema, obtemos x = 7, y = —4. Assim, A(u,) = 7u, — 4u,. 

(2) Em seguida, escrevemos A(u,) como uma combinação linear de u, e u,. Temos 


3 -21|2 —4 1 2 x+2y = —4 
= — = e, portanto, 
Alto) Ê HIH E HESH j 2x+5y =—7 
Resolvendo o sistema, obtemos x = —6, y = 1. Assim, A(u,) = —6u, + u,. Escrevendo as coordenadas de A(u,) 
e A(u,) como colunas, obtemos a representação matricial de A, como segue. 


TEE 


OBSERVAÇÃO Se quisermos encontrar a representação matricial de A em relação à base canônica E = (e,, e,} 
= ([1, 0], [0, 1]"} de Rº, calculamos 
| =3e, + 4e, 


seo= [4 slol = 


wp E-E- 


Observe que [A], é a matriz original A. Esse resultado vale em geral. 


e, portanto, [A]; = É 5] 


A representação matricial de qualquer matriz A n X n sobre K em relação à base 
canônica E de K" é a própria matriz 4, ou seja 


[A]; =Á 


Algoritmo para determinar representações matriciais 


Apresentamos a seguir um algoritmo para encontrar representações matriciais. O primeiro Passo 0 é opcional. Pode 
ser útil no Passo 1(b), que é repetido para cada vetor de base. 


Algoritmo 6.1 Dados um operador linear T de um espaço vetorial Ve uma base S = {u,, 15, ..., 4,) de V, calcu- 
lamos a representação matricial [7]ç. 
Passo 0 Determine uma fórmula para as coordenadas de um vetor arbitrário v em relação à base S. 
Passo 1 Repita, para cada vetor u, de S, 
(a) Calcule T(u,). 
(b) Escreva T(u,) como uma combinação linear dos vetores u, uz, ..., u, da base S. 
Passo 2 Forme a matriz [7],. cujas colunas são os vetores de coordenadas do Passo 1(b). 


Exemplo 6.3 Seja F: R? — R? definida por F(x, y) = (2x + 3y, 4x — 5y). Encontre a representação matricial 
[F]; de F em relação à base S = (u,, u} = ((1,-2), (2,-5)). 
(Passo 0) Primeiro calculamos as coordenadas de (a, b) € R? em relação à base S. Temos 


alo 1 2 x+2y=a x+2y=a 
BS E ou Disp ou E 
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Resolvendo x e y em termos de a e b, obtemos x = 5a + 2b, y = —2a — b. Assim, 
(a,b) = (5a + 2b)u, + (—2a — b)u, 


(Passo 1) Agora calculamos F(u,) e escrevemos esse vetor como uma combinação linear de u, e u, usando a fór- 
mula de (a, b) e, depois, repetimos esse processo para F(u,). Temos 


F(u) = F(1, —2) = (—4, 14) = 8u — 6u, 
F(u) = F(2,—5) = (—11,33) = 11u, — 11u 


(Passo 2) Finalmente, escrevemos as coordenadas de F(u,) e F(u,) como as colunas para obter a matriz procurada. 
8 11 
[F Is = | E | 


Propriedades da representação matricial 


Nesta subseção mostramos as principais propriedades das representações matriciais de operadores lineares T de um 
espaço vetorial V. Enfatizamos que sempre estamos considerando dada uma base S de V específica dada. 

Nosso primeiro teorema, demonstrado no Problema 6.9, nos diz que a “ação” de um operador linear T num 
vetor v é preservada por sua representação matricial. 


Teorema 6.1 Sejam T:V — V um operador linear e S uma base (finita) de V. Então, para qualquer vetor v de V, 
[T]slv]s = [TOs 
Exemplo 6.4 Considere o operador linear F de R? e a base S do Exemplo 6.3, isto é, 
F(x,y) = (2x + 3y, 4x -— 5y) e S = {uu} = {(1,—2), (2,—5)} 
Seja 
v= (5,—7), eœ, portanto, F(v)= (—11,55) 
Usando a fórmula do Exemplo 6.3, obtemos 
[W=[11,-3" œ LF (v)] = [55, —33]” 


Verificamos o Teorema 6.1 para esse vetor v (onde [F] foi obtida no Exemplo 6.3): 


rief ulil- = ro 


Dada uma particular base § de um espaço vetorial V, associamos uma matriz [T] a cada operador linear T da 
álgebra A(V) dos operadores lineares de V. O Teorema 6.1 nos diz que a “ação” de cada operador linear individual 
T é preservada por essa representação. Os próximos dois teoremas (demonstrados nos Problemas 6.10 e 6.11) nos 
dizem que também são preservadas as três operações básicas de A(V) com esses operadores, a saber, (i) a adição, 
(ii) a multiplicação por escalar e (iii) a composição. 


Teorema 6.2 Sejam V um espaço de dimensão n sobre K, S uma base de V e M a álgebra das matrizes n x n sobre 
K. Então a aplicação 

m:A(V) >M -definidapor m(T) = [T]; 
é um isomorfismo de espaços vetoriais. Isto é, para quaisquer F, G € A(V)ek € K, valem 


G) m(F+G)=m(F)+m(G) ou [F + G] = [F] + [G] 
Gi) m(kF) = km(F) ou [kF] = k[F] 
(iii) m é uma bijeção (injetora e sobre). 
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Teorema 6.3 Dados quaisquer operadores lineares F, G € A(V), 
m(G o F) = m(G)m(F) or [Go F] = [G][F] 


(onde G o F representa a composição das aplicações G e F). 


6.3 MUDANÇA DE BASE 


Seja V um espaço vetorial de dimensão n sobre um corpo K. Mostramos que, uma vez selecionada uma base S de 
V, cada vetor v € V pode ser representado por meio de uma ênupla [v], em K” e que cada operador linear T de A(V) 
pode ser representado como uma matriz n x n sobre K. E natural formular a questão seguinte. 


Como mudam essas representações se selecionarmos uma outra base? 


Para responder essa pergunta, precisamos de mais uma definição. 


DEFINIÇÃO Sejam S = (u,, U», ..., u,) uma base do espaço vetorial Ve S' = (v,,v5,..., U, } uma outra base. 
(Para referência futura, dizemos que S é a base “antiga” e S' a base “nova”.) Como S é uma base, cada vetor da base 
“nova” S' pode ser escrito, de maneira única, como uma combinação linear dos vetores de S, digamos, 


Vi = QU, + duo + F dan 
U = AU] + Azzz eo F don, 
Va = AU T Anu + T AnnUn 


Seja P a transposta dessa matriz de coeficientes, ou seja, P = [p], onde p, = a;. Então P é denominada matriz de 
mudança de base (ou matriz de transição) da base “antiga” S para a base “nova” S”. 


Destacamos as observações seguintes. 


OBSERVAÇÃO 1 A matriz de mudança de base P pode ser vista como a matriz cujas colunas são, respectivamen- 
te, os vetores coluna de coordenadas dos “novos” vetores v, da base em relação à base “antiga S, a saber, 


PS [vi]s, [vz]; eey [vls] 


OBSERVAÇÃO 2 Analogamente, existe uma matriz de mudança de base Q da “nova” base S” para a base “anti- 
ga” S. Da mesma forma, Q pode ser vista como a matriz cujas colunas são, respectivamente, os vetores coluna de 
coordenadas dos “antigos” vetores u, da base em relação à base “nova S’, a saber, 


O = [[tn]so [u2)so -nls 


OBSERVAÇÃO 3 Como os vetores v, v,, ..., v, da nova base S’ são linearmente independentes, a matriz P é in- 
vertível (Problema 6.18). Analogamente, Q é invertível. De fato, a proposição seguinte é válida (demonstrada no 
Problema 6.18). 


Proposição 6.4 Sejam P e Q as matrizes de mudança de base discutidas acima. Então Q = P-1. 


Sejam, agora, {u}, Uz, ..., 4,) uma base de um espaço vetorial Ve P = [p,] uma matriz 
não singular qualquer. Então os n vetores 


Vi = Pill; + Polo + + Pala i= 1,2,...,n 


correspondentes às colunas de P, são linearmente independentes [Problema 6.21(a)]. Assim, determinam uma ou- 
tra base S’ de V. Além disso, P é a matriz de mudança de base de S para a nova base S”. 
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Exemplo 6.5 Considere as duas bases de R? dadas a seguir. 


S = (uu) = {(1,2), (3,5)} e S = (0, v} = {(1,—1), (1,—2)} 


(a) Encontre a matriz P de mudança de base de S para a “nova” base S’. 
Escrevemos cada um dos novos vetores de S’ como uma combinação linear dos vetores u, e u, da 
base original S. obtendo 


3 x+3y=1 o o 
DH ou E used que fornece x=-8, y=3 


+95] ou e que fornece x=-11, y=4 


5 2x+4+5y=—1 
Assim, 
v = —8uy + 3u ; E 
e, portanto, P= . 
Vz == =l l = 4u, 3 4 


Observe que as coordenadas de v, e v, são as colunas, e não as linhas, da matriz de mudança de base P. 
(b) Encontre a matriz Q de mudança de base da “nova” base S’ de volta à base “antiga” S. 
Agora escrevemos cada um dos “antigos” vetores de base u, e u, de S como uma combinação linear 
1 2 
dos “novos” vetores v, e v, da base S’, obtendo 


u = 4v — 3v 


4 11 
tanto, = 
neall- HME g 5 | 


Como era de se esperar pela Proposição 6.4, Q = P-1. (De fato, poderíamos ter obtido Q simplesmente 
calculando P-!) 


Exemplo 6.6 Considere as duas bases de R? dadas a seguir. 


E = (e,,e,,e3) = ((1,0,0), (0,1,0), (0,0,1)) 
e S = {u , u, u3} = {(1,0, 1), (2,1,2), (1,2,2)) 
(a) Encontre a matriz P de mudança da base E para a base S. 


Como E é a base canônica, podemos escrever imediatamente cada elemento da base $ como uma 
combinação linear dos vetores da base E. Mais precisamente, 


u = (1,0,1)= e+ es 12 1 
u = (2,1,2) = 2e; + e +2e, e portanto, P=|0 1 2 
us = (1,2,2) = e; + 2e, + 2e, 12 2 


Novamente, as coordenadas de u,, u, e u, são as colunas de P. Observe que P simplesmente é a matriz 
cujas colunas são os vetores da base S. Isso só é válido porque a base original é a base canônica E. 
(b) Encontre a matriz Q de mudança da base S para a base E. 
A definição da matriz de mudança de base Q nos faz escrever cada um dos vetores da base canônica 
como uma combinação linear dos elementos da base S. Obtemos 


e; = (1,0,0) = —2u, + 2u, — us -2 -2 3 
e, = (0,1,0) = —2u, + u e, portanto, Q=] 2 1 -2 
e, = (0,0,1) = 3u; — 2u, + u3 -1 0 1 


Enfatizamos que, para encontrar Q, precisamos resolver três sistemas de três equações lineares com três 
incógnitas, sendo um sistema 3 x 3 para cada um dos vetores e,, e, € ez. 
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Alternativamente, poderíamos ter calculado Q = P~! formando a matriz M = [P, 1] e reduzindo M à forma 
canônica por linhas. 


121100 
M=ļl|0 1 201 Ole/D 10 2 res 
122001 


-2 —2 3 
Assim, Q=P!=| 2 1 -2 
-1 0 1 


(Aqui utilizamos que Q é a inversa de P.) 


O resultado do Exemplo 6.6(a) é geral. Como é muito utilizado, destacamos esse resultado formalmente. 


z 


Proposição 6.5 A matriz de mudança de base da base usual E de K” para qualquer outra base S de K” é a matriz 
P cujas colunas são, respectivamente, os vetores da base de S. 


Aplicações da matriz de mudança de base 


Inicialmente vejamos como uma mudança de base afeta as coordenadas de um vetor de um espaço vetorial V. O 
teorema seguinte está demonstrado no Problema 6.22. 


Teorema 6.6 Seja P a matriz de mudança de base de uma base S para uma base $’ de um espaço vetorial V. Então, 
dado um vetor v € V qualquer, temos 


Pllg = [vs e portanto,  Plvç= [lo 


Em palavras, multiplicando as coordenadas de v na base original S por P7!, obtemos as coordenadas de v na 
nova base S’. 


OBSERVAÇÃO 1 Embora P seja dita a matriz de mudança de base da base antiga S para a nova base S’, enfati- 
zamos que é a matriz P~! que transforma as coordenadas de v na base original S para as coordenadas de v na nova 
base S”. 


OBSERVAÇÃO 2 Por causa do teorema, muitos livros consideram Q = P” le não P, a matriz de mudança de 
base da base antiga S para a base nova S’. Alguns livros também se referem a Q como a matriz de mudança de 
coordenadas. 


Vejamos, agora, a demonstração do teorema no caso particular em que dim V = 3. Seja P a matriz de mudança 
de base da base S = {u,, u,, u,) para a base S” = (v,, v2, v3 +, digamos, 


vi = AU] T dous T 4343 a b c 
v, = bju, + bzu + b3u3 e, portanto, P=|a b c 
U3 = Cjuy T CU T Cas a by c3 


Seja, agora, v € V dado e digamos que v = kv, + kau + k;v5. Então, substituindo as expressões de v,, v,, va, 
obtemos 


v = k (au ) duz ) asus) ) ko(byu, } bzu } bus) } kz (ciu + Cau + Caus) 
= (aik; + bik, + ciks )u; + (azk; + brk + coks Jus + (azk + bah, + czk )u3 
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Assim, 
kı ak + bik, + cik 
[ols =|% e [ols = | akı + bzh + coks 
ks azk + bak» + Cah 


a bi C] k ak, + byk, + cik 
Plos = |a b ollh|=|ak+bh+ck | = los 
as b, C3 ks ask; + bah» ET c3k3 


Finalmente, multiplicando a equação [u] s =P [u] s por P-1 obtemos 
Pos = PPjolo = Io) g = [ols 


O teorema seguinte (demonstrado no Problema 6.26) mostra como uma mudança de base afeta a representação 
matricial de um operador linear. 


Teorema 6.7 Seja P a matriz de mudança de base de uma base S para uma base $’ de um espaço vetorial V. Então, 
dado um operador linear T qualquer de V, 


=i 
[T]s =P [T];P 
Ou seja, se A e B são as representações matriciais de T em relação às bases S e S”, respectivamente, então 
B = P'AP 
Exemplo 6.7 Considere as duas bases de R? dadas a seguir. 


E = {e;,e3,e3} = {(1,0,0), (0,1,0), (0,0,1)} 
e S = {u u, u3} = {(1,0,1), (2,1,2), (1,2,2)} 
A matriz de mudança de base P de E para S e sua inversa P~! foram obtidas no Exemplo 6.6. 


(a) Escreva v = (1, 3, 5) como uma combinação linear de u,, u,, u, ou, equivalentemente, calcule [v]ç. 
Uma maneira de fazer isso é resolver diretamente a equação vetorial v = xu; + yu, + zuz, OU seja, 


1 1 2 1 x+2y+ z=1 
3|=x/0| +y|1|4+2]2 ou y+22=3 
5 1 2 2 x+2y+2z=5 


A solução é x = 7, y = —5, z = 4, portanto, v = 7u; — Su, + 4u,. 


Por outro lado, sabemos que [v]; = [1,3, 5)", porque E é a base canônica e já conhecemos P-!. Portanto, 
pelo Teorema 6.6, 


—2 —2 3 1 I 
lols =P i=] 2 1 -2||3/=|-5 
—l 0 1 5 4 
Assim, novamente, v = 7u; — Su, + 4us. 
3 -2 
(b) Seja 4 = |2 —4 1 |, que pode ser vista como um operador linear de RÌ. Encontre a matriz B que repre- 
3 -1 2 


senta A em relação à base S. 
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A definição de representação matricial de A em relação à base S diz que devemos escrever cada um dos 
vetores A(u,), A(u,), A(u,) como uma combinação linear dos vetores u,, u,, u, de S. Obtemos 


A(u) = (—1,3,5) = 11u; — Su, + 6us 11 21 17 
A(u) = (1,2,9) = 2lu, — 14u, + 8us e, portanto, B= |—5 -14 -8 
A(uz3) = (3, —4,5) = 17u; — 8e, + 2u5 6 8 2 


Enfatizamos que, para encontrar B, precisamos resolver três sistemas de três equações lineares com três incóg- 
nitas, sendo um sistema 3 x 3 para cada um dos vetores A(u,), A(u,), A(u,). 
Por outro lado, como conhecemos P e P-!, podemos utilizar o Teorema 6.7, a saber, 


—2 =2 3 1 3 —2||1 2 1 11 21 17 
B = P'AP = 2 1 —2|]|2 —4 1/0 1 2)=/-5 -14 -8 
=] 0 1 3 =l 2jjl1 2 2 6 8 2 


Como era de se esperar, obtemos o mesmo resultado. 


6.4 SEMELHANÇA 


Sejam A e B matrizes quadradas para as quais existe uma matriz invertível P tal que B = P7!AP. Nesse caso, di- 
zemos que B é semelhante a A ou então, obtida de A por uma transformação de semelhança. Mostramos (Problema 
6.29) que a semelhança de matrizes é uma relação de equivalência. 

Pelo Teorema 6.7 e essa última observação, obtemos o resultado a seguir. 


Teorema 6.8 Duas matrizes representam o mesmo operador linear se, e só se, as matrizes são semelhantes. 


Assim, todas as representações matriciais de um operador linear T formam uma classe de equivalência de ma- 
trizes semelhantes. 

Um operador linear T é dito diagonalizável se existe uma base S de V na qual T é representado por uma matriz 
diagonal; nesse caso, dizemos que a base S diagonaliza T. O teorema precedente fornece o resultado seguinte. 


Teorema 6.9 Seja A a representação matricial de um operador linear T. Então T é diagonalizável se, e só se, existe 
uma matriz invertível P tal que P-!LAP é uma matriz diagonal. 


Assim, T é diagonalizável se, e só se, sua representação matricial pode ser diagonalizada por uma transforma- 
ção de semelhança. 

Enfatizamos que nem todo operador é diagonalizável. Contudo, mostraremos (Capítulo 10) que todo operador 
linear pode ser representado por certas matrizes “padrão” denominadas formas normais ou canônicas. Para essa 
discussão, necessitamos de alguma teoria de corpos, polinômios e determinantes. 


Funções e matrizes semelhantes 


Seja f uma função de matrizes quadradas que associa o mesmo valor a matrizes semelhantes, isto é, f(A) = f(B) 
sempre que A é semelhante a B. Então f induz, de uma maneira natural, uma função de operadores lineares T, tam- 
bém denotada por f, como segue. Definimos 


onde S é uma base qualquer. Pelo Teorema 6.8, essa função está bem definida. 
Talvez o mais importante exemplo dessas funções seja o determinante (Capítulo 8). O traço (Seção 2.7) é um 
outro exemplo importante. 
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Exemplo 6.8 Considere o operador linear F e as bases E e S de R? a seguir. 
F(x,y) = (2x + 3y, 4x — 5y), E = {(1,0), (0,1)}, S = {(1,2), (2,5)} 


Pelo Exemplo 6.1, as representações matriciais de F em relação às bases E e S são, respectivamente, 


23 52 129 
ta E ° sla E 


Usando a matriz 4, temos 

(i) Determinante de F = det(A) = —10 — 12 = -22; (i) Traço de F = tr(A) = 2 — 5 3. 

Por outro lado, usando a matriz B, temos 

(1) Determinante de F = det(B) = -2860 + 2838 = -22; (ii) Traço de F = tr(B) = 52 — 55 = 3. 
Conforme esperado, ambas matrizes fornecem o mesmo resultado. 


6.5 MATRIZES E TRANSFORMAÇÕES LINEARES ARBITRÁRIAS 


Por último, consideramos o caso geral de transformações lineares de um espaço vetorial num outro. Sejam Ve U 
espaços vetoriais sobre o mesmo corpo K e, digamos, que dim V = me dim U = n. Além disso, sejam 


S= ER RM, e S' = UR RR A 


respectivamente, bases arbitrárias fixadas de Ve U. 
Suponha que F: V — U seja uma transformação linear. Então os vetores F(v)), Fw), ..., F(v,) pertencem a U 
e, portanto, cada um é uma combinação linear dos vetores da base S’, digamos, 


F(v) = Gy T dz Ainun 
F(v,) = azu; + au, Anun 
F(v,) = GM + Am2u2 ig Amnn 


DEFINIÇÃO A transposta da matriz de coeficientes [a], denotada por ms g (F) ou [F]s s, é denominada repre- 
sentação matricial de F em relação às bases S e S”, Utilizamos a notação mais simples m(F) e [F] quando as bases 
estiverem subentendidas. 


O teorema seguinte é análogo ao Teorema 6.1 relativo a operadores lineares (Problema 6.67). 


Teorema 6.10 Dado qualquer v € V, temos [F]; g [v] = [F (v)] y- 


Assim, as coordenadas de F(v) na base S’ de U são obtidas pela multiplicação das coordenadas de v na base $ 
de V por [F]. 

Vimos que, dados quaisquer espaços vetoriais Ve U, a coleção de todas as transformações lineares de V em U 
é um espaço vetorial denotado por Hom(V, U). O teorema seguinte é análogo ao Teorema 6.2 relativo a operadores 
lineares, em que, agora, M = M, , denota o espaço vetorial de todas as matrizes m x n (Problema 6.67). 


Teorema 6.11 A aplicação m: Hom(V, U) — M definida por m(F) = [F] é um isomorfismo de espaços veto- 
riais, ou seja, dados quaisquer F, G € Hom(V, U ) e escalar k, temos 

Dm(F+G)=m(F) +m(G)ou[F + G] = [F] + [G] 

Gi) m(kF) = km(F) ou [kF] = k[F] 


(iii) m é uma bijeção (injetora e sobre). 
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Nosso próximo teorema é análogo ao Teorema 6.3 relativo a operadores lineares (Problema 6.67). 


Teorema 6.12 Sejam S, S’ e S” bases dos espaços vetoriais V, U e W, respectivamente. Sejam F: V >Ue 
Go U — W transformações lineares. Então 


[G o Fls = [G] s s Fls. 


Ou seja, em relação a bases apropriadas, a representação matricial da composta de duas transformações linea- 
res é a matriz produto das representações matriciais das transformações individuais. 

Em seguida, veremos como a representação matricial de uma transformação linear F: V — U é afetada quan- 
do selecionamos bases novas. 


Teorema 6.13 Seja P a matriz de mudança de base de uma base e para uma base e' de Ve seja Q a matriz de mu- 
dança de base de uma base f para uma base f’ de U. Então, dada qualquer transformação linear F: V > U, 


[Fey = O HFl.;P 


Em outras palavras, se A é a representação matricial de uma transformação linear F relativa às bases e e f, e se 
B é a representação matricial de F nas bases e'e f’, então 


B = Q`!AP 


Nosso último teorema, demonstrado no Problema 6.36, mostra que toda transformação linear de um espaço 
vetorial V num outro espaço vetorial U pode ser representada por uma matriz muito simples. Observamos que esse 
teorema é análogo ao Teorema 3.18 relativo a matrizes m x n. 


Teorema 6.14 Seja F: V — U uma transformação linear, digamos, com pos(F) = r. Então existem bases de Ve 
de U tais que a representação matricial de F é da forma 


10 
1=[6 o 


em que 1, é a matriz identidade de ordem r. 
A matriz A desse teorema é denominada forma normal ou canônica da transformação linear F. 


Problemas Resolvidos 


Representação matricial de operadores lineares 


6.1 Considere a transformação linear F: R? — R? definida por F(x,y) = (3x +4y, 2x — 5y)e as bases de 
R seguintes. 


E = (er) = {(1,0), (0,1)} e S = uu) = {(1,2), (2,3)} 
(a) Encontre a matriz A que representa F em relação à base E. 


(b) Encontre a matriz B que representa F em relação à base S. 


(a) Como E é a base canônica, as linhas de A são, simplesmente, os coeficientes dos componentes de F(x, y), ou seja, 
usando (a, b) = ae, + be,, temos 


F(e,) = F(1,0) = (3,2) =3e,+2e, 
1 


1 = 3 4 
; tanto, = 
Ple) -F0 ijs {4de PANE À | 


2. =5 


Observe que os coeficientes dos vetores da base estão escritos como colunas na representação matricial. 
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(b) Começamos calculando F(u,) e escrevendo esse vetor como uma combinação linear dos vetores u, e u, da base. 
Temos 


x+2y= 11 


F(u) = F(1,2) = (11, —8) = x(1,2) + y(2,3), e, portanto, 2x + 3y = -8 


Resolvemos o sistema para obter x = —49, y = 30. Logo, 
F(u) = —49u; + 30u 


Em seguida, calculamos F(u,) e escrevemos esse vetor como uma combinação linear dos vetores u, e u,. Temos 


F(u) = F(2,3) = (18, —11) = x(1,2) + y(2,3), e, portanto, ri E = E 
Resolvemos em x e y e obtemos x = —76, y = 47. Logo, 
F(u,) = —76u, + 47u 
Agora escrevemos os coeficientes de u, e u, como colunas, para obter B = | p E 


(b) Alternativamente, podemos calcular primeiro as coordenadas de um vetor (a, b) arbitrário de R° em 
relação à base S. Temos 
x+2y=a 


(a,b) = x(1,2) + y(2,3) = (x + 2y, 2x + 3y), e, portanto, pEb 


Resolvemos x e y em termos de a e b para obter x = -3a + 2b, y = 2a — b. Assim, 


(a,b) = (—3a + 2b)u, + (2a — bJu, 


Em seguida, usamos a fórmula de (a, b) para encontrar as coordenadas de F(u,) e F(u,) em relação a S, como segue. 


F(u) = F(1,2) = (11,-8) = —49u, + 30u, 


—49 =76 
F(u) = F(2,3) = (18,-11) = —76u, + 47u, 


30 47 


e, portanto, B = | 


6.2 Sejam G o operador linear de R° e S a base dados a seguir. 
G(x, y) = (2x — 7y, 4x + 3y) e S= {m,m} = {(1,3), (2,5)} 
(a) Encontre a representação matricial [G], de G em relação a S. 


(b) Verifique [G]slvls = [G(v)]s para o vetor v = (4, —3) de R’. 


Começamos calculando as coordenadas de um vetor v = (a, b) arbitrário de R? em relação à base S, obtendo 


a -ll E, 2 t t x+2y=a 
b| = *l3| TY|s5]|? S portanto, gps sy=b 


Resolvemos x e y em termos de a e b para obter x = -5a + 2b, y = 3a — b. Assim, 


(a,b) = (—5a + 2b)u, + (3a — bju», e, portanto, [v] = [-5a +2b, 3a- b|” 


(a) Usando a fórmula de (a, b) e G(x, y) = (2x — 7y, 4x + 3y), obtemos 


G(u,) = G(1,3) = (—19, 13) = 1214, — 70u 
= (—31,23 


G(1,3 121 201 
G(u,) = G(2,5) 23) = 2014, — 1164, 


e, portanto, ot = [ TG 


(Enfatizamos que os coeficientes de u, e u, aparecem como colunas, e não linhas, na representação matricial.) 
(b) Usamos a fórmula (a, b) = (—5a + 2b)u, + (3a — bJu, para obter 


v = (4, —3) = —26u; + 15u 
G(v) = G(4,-3) = (20,7) = -13 1u; + 80u, 


Então [vls = [-26, 15)” e [G(v)ls = [-131,80]7 


6.3 


6.4 


6.5 
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Assim, 


121 201 | | —26 —131 
ame a e ae 
(Isso é o esperado, segundo o Teorema 6.1.) 


Sejam A a matriz quadrada de ordem 2 e S a base de R° dadas a seguir. 


aa) e s-tme-l[i) [5)) 


A matriz A define um operador linear de R°. Encontre a matriz B que representa a transformação A em 
relação à base S. 


Começamos calculando as coordenadas de um vetor (a, b)” arbitrário em relação à base S, obtendo 


aj 1 3 x+3y=a 
[5] ==[5) +14] Mo o-D=b 


Resolvemos x e y em termos de a e b para obter x = 7a + 3b, y = -2a — b. Assim, 


(a, b)” = (Ta + 3b)u, + (—2a — b)u, 


f 7 T = 
Em seguida, usamos a fórmula de (a, b) para encontrar as coordenadas de Au, e Au, em relação a S, como segue. 


2 4 1] —6 
Au; = | || = | | = —63u, + 19u, 


5 6 2| — 
sasl | Pio Ale 
a= een |] e 
Escrevendo as coordenadas como colunas, obtemos 
[—-63 -235 
B= 19 a 


ad pis . 3: A A$ 
Encontre a representação matricial de cada um dos operadores lineares F de R` em relação à base canônica 
3 E 
E = (e,,e,,e;]) de R', ou seja, encontre [F] = [F]; 


(a) F definido por F (x,y,z) = (x + 2y — 3z, 4x — 5y — 6z, 7x + 8y + 92). 
1 11 
(b) F definido pela matriz de ordem 3 4 = |2 3 4 
5 55 
(c) F definido por F(e,) = (1,3,5),F(e,) = (2,4,6), F(e;) = (7,7,7). (O Teorema 5.2 afirma que 


uma transformação linear fica completamente definida por sua ação nos vetores de uma base.) 


(a) Como E é a base canônica, simplesmente escrevemos os coeficientes dos componentes de F(x, y, z) como colunas. 


1 2 —3 
F]=l4 -5 —6 
7 8 9 


(b) Como E é a base canônica, [F] = A, a própria matriz A. 


(c) Aqui 


‘AAN 
NNN 


1,3,5 i 
F(e,) = (2,4,6) = 2e, + 4e, + 6e; e, portanto, |F] = |3 
F(e3) = (7,7,7) = 7e, + 7e, + Te; 5 


Assim, as colunas de [F] são as imagens dos vetores da base canônica. 


Seja G o operador linear de Rº definido por G(x, y, z) = (2y +z, x — 4y, 3x). 
(a) Encontre a representação matricial de G em relação à base 


S = {w;, w2, w3} = {(1,1,1), (1,1,0), (1,0,0)} 


E 216 ENS 


(b) Verifique que [G][v] = [G(v)], para cada vetor v de R'. 


3 ERRA NE aa ii 
Começamos calculando as coordenadas de um vetor (a, b, c) € R` arbitrário em relação à base S. Escrevemos (a, b, 
c) como uma combinação linear de w,, w,, w, usando escalares x, y, z incógnitos, obtendo 


(a,b,c) = x(1,1,1) +(1,1,0) +2(1,0,0) = (x +y +z, x+y, x) 
Igualando os componentes correspondentes, obtemos o sistema de equações 


x+y+z=a, x+y=b, =g 


Resolvendo o sistema para x, y, z em termos de a, b, c obtemos x = c, y = b — c, z = a — b. Assim, 


(a,b,c) = cw; + (b — c)w, + (a — b)w;, ou, equivalentemente, [(a,b,c)] = |c, b-c, a—b/ 


(a) Como G(x, y,z) = (2y +z, x — 4y, 3x), 


G(w) = G(1,1,1) = (3, —3,3) = 3w, — 6x, + 6x3 
Gw) = GO, L0) = (2,33) = 3w = 6w; 45w; 
G(ws = G(1,0, 0) = (0, 1,3) = = 3w; = 2w, — W3 


Escrevemos as coordenadas G(w,), G(w,), G(w3) em colunas para obter 


3 3 3 
[G]= | -6 -6 -2 
6 5 À 


(b) Escrevemos G(v) como uma combinação linear de w,, w,, w,, sendo v = (a, b, c) um vetor arbitrário de R°. 
G(v) = G(a,b,c) = (2b +c, a — 4b, 3a) = 3aw, + (—2a — 4b)w, + (—a + 6b + c)w; 


ou, equivalentemente, 


Assim, 
3 3 3 c 3a 
[Gllv)=|-6 -6 -2||b-c|=| —-2a-4b | =[G(v)] 
6 5 — a—b —a+6b+c 


6.6 Sejam A a matriz quadrada de ordem 3 e S a base de Rº dadas a seguir. 


1 —2 l l 0 l 
A= 3 -1 0 e S = {u}, u3, u3} = 1 ; 1 ; 
1 4 -2 1 1 3 


. . . 3 . ~ 
A matriz A define um operador linear de R`. Encontre a matriz B que representa a transformação A em rela- 
2. A Z : 2. A AU! 3 
ção à base S. (Já sabemos que A representa a si mesma em relação à base canônica de R'.) 


Começamos calculando as coordenadas de um vetor (a, b, c) de R° arbitrário em relação à base S, obtendo 


a 1 0 1 x+ z=a 
b|l=x|1|+y|1|+2z]2 ou x+y+2z=b 
c 1 1 3 yF =. 


Resolvemos x, y, z em termos de a, b, c para obter 


x=a+b-cy=-a+2b-cz=c—b 
Assim, (abc) =(atb-cu + (~a + 2b — c)u + (c — bu 


6.7 


6.8 


6.9 
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F 5 T Ea 
Em seguida, usamos a fórmula de (a, b,c) para encontrar as coordenadas de Au,, Au,, Au, em relação à base S, como 
segue. 


A(u) = A(1,1,1)7 = (0,2,3)7 =>u4U + u + u3 —1 —4 -2 
Alu) = 4(1,1,0) = (-1,-1,2)7 = —4u, — 3u, + 3u; , portanto, B= | 1 -3 —1 
Aus) = A(1,2,3)7 = (0,1,3)? = —2u; — u, + 2u; 1 3 2 


As E 2 E E 
Para cada uma das transformações lineares (operadores) L de R“ a seguir, encontre a matriz A que representa 
a a AS 2 
L (em relação à base canônica de R^). 


(a) L é definida por L(1, 0) = (2, 4) e L(0, 1) = (5, 8). 
(b) Lé a rotação de R? no sentido anti-horário por 90º. 
(c) L éa reflexão de R? em torno da reta y = x. 


(a) Como {(1, 0), (0, 1)} é a base canônica de RŽ, escrevemos as imagens por L como colunas para obter 


(b) Pela rotação L, temos L(1,0) = (0, 1) e L(0, 1) = (—1, 0). Assim, 


0 —1 

a= [i o] 

(c) Pela reflexão L, temos L(1, 0) = (0, -1) e L(0, 1) = (-1, 0). Assim, 
0 —1 

de 


O conjunto S = fes. te, Pet) é uma base do espaço vetorial V de funções f: R — R. Seja D o operador 
derivada de V, ou seja, D(f) = df/dt. Encontre a representação matricial de D em relação à base S. 
Calculamos a imagem de cada função da base, como segue. 


D(e*) =3e% = 3(e%) + O(te?") + 0(Pe!) 3 
D(te%) =e” +3te” = 1(e%) + 3(te™)+0(te%) e, portanto, [D]J=|0 
D(2e) = 2te +3Pe = (EN) + Mt) +3I(Pe*) 0 


Sw m 
vw O 


Demonstre o Teorema 6.1. Sejam T: V — V um operador linear e S uma base (finita) de V. Então, para 
qualquer vetor v de V, [Tv]; = [T(v)]s. 
Seja S = (u,, u, ..., u,) e suponha que, para i = 1,...,n, 
T(u) = aqu + apu ++ dintin = Et 
Então [7], é a matriz quadrada de ordem n cuja j-ésima linha é 
(dij, aaj; - - s Aj) (1) 
Agora, vamos supor que 
n 
v = kyu, + kyu + + k,n = X ku; 
i=l 
Escrevendo um vetor coluna como a transposta de um vetor linha, temos 
T 
[v]s = [ki kz; -+ -kal 2) 


Além disso, usando a linearidade de T, 


Eil Árcesra Linear 


6.10 


6.11 


1 
j=1 \i= 


j=1 
Assim, [T(v)]; é o vetor coluna cuja j-ésima entrada é 
jk + azk pesso Amin (3) 


Por outro lado, a j-ésima entrada de [7] slu] s é obtida multiplicando a j-ésima linha de [T]; por [v], ou seja, (1) por (2). 
Mas o produto de (1) por (2) é (3). Logo, [7] ,lvlç e [Tw)]; têm as mesmas entradas. Assim, [Tv], = [TW]. 


Demonstre o Teorema 6.2. Sejam S = {u}, 45, ..., u,) uma base de V sobre K e M a álgebra das matrizes qua- 
dradas de ordem n sobre K. Então a aplicação m: A(V) — M definida por m(T) = [T]; é um isomorfismo de 
espaços vetoriais. Isto é, para quaisquer F, G € A(V)ek € K, valem 


0) [F +G] = [F] + [G], GD [kF] = k|F], Gii m é injetora e sobre. 


(1) Suponha que, para i = 1,...,n, 


Considere as matrizes A = la, eB= [b]. Então [F] = Ae [G] = B”. Para i = 1,...,n, temos 


(F + G)(u;) = F(u;) + G(u;) = 


n 
Da; + bju; 


j=1 


Como A + B é a matriz la, + bi), temos 
[F +G] = (4+ B)” = A7 + B! = [F] + [G] 


Gi) Parai = 1, ..., n, 


Como KA é a matriz [ka,|, temos 


[kF] = (kA) = k4” = k[F] 


(iii) Finalmente, m é injetora, porque uma transformação linear fica completamente determinada por seus valores numa 
base. Também m é sobre, porque a matriz A = [a,] de M é a imagem do operador linear 


n 
F(u;) = >, au; i= lgt 
j=1 
Assim, O teorema está demonstrado. 


Demonstre o Teorema 6.3. Dados quaisquer operadores lineares G, F € A(V), vale [G o F] = [G][F]. 


Usando a notação do Problema 6.10, temos 


Lembre que AB é a matriz AB = [c], com cC; = si Aijb;k. Por isso, 


[G o F] = (4B) = BTA? = [G|[F] 


Isso prova o teorema. 
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6.12 Seja A a representação matricial de um operador linear T. Prove que, dado qualquer polinômio f(t), temos 
que fA) é a representação matricial de f(T). [Assim, AT) = 0 se, e só se, HA) = 0.] 
Seja & a aplicação que leva cada operador T em sua representação matricial A. Queremos provar que P(f(T)) = f (4). 
Suponha que f(t) = a,t” + -- -+ aıt + ag. A demonstração é por indução em n, o grau de f(t). 
Suponha que n = 0. Lembre que 4 (1) = Z, onde T7' é a transformação identidade e 7 é a matriz identidade. Assim, 


HD) = lag!) = ago U’) = aol = f (4) 


e, portanto, o teorema vale para n = 0. 
Agora supomos que o teorema valha para polinômios de grau menor do que n. Então, como & é um isomorfismo de 
álgebras, 


HT) = Ha” + ap T"! + aT + agl’) 
=a p(T)O(T"!) + olap T"! +--+ aT +a’) 
= aAA"! + (a, 14A"! +- +ajA +a) = f(A) 


e terminamos a demonstração do teorema. 


Mudança de base 


Nesta seção, o vetor de coordenadas [v], sempre denota um vetor coluna, ou seja, 
= T 
[vls = [01,45,...,4,] 


6.13 Considere as bases de R? a seguir. 
E = {e;,e2} = 1(1,0), (0,1) £ S = (uu) = {(1,3), (1,4)} 
(a) Encontre a matriz de mudança de base P da base canônica E para S. 
(b) Encontre a matriz de mudança de base Q de S de volta para E. 


(c) Encontre o vetor de coordenadas [v] de v = (5, -3) em relação a S. 


P dd ; 11 
(a) Como E é a base canônica, simplesmente escrevemos os vetores da base § como colunas: P = Ê 4 
(b) Método 1 Usamos a definição de matriz de mudança de base, ou seja, escrevemos cada vetor de E como uma 
combinação linear dos vetores de S. Para isso, começamos calculando as coordenadas de um vetor v = (a, b) 
arbitrário em relação a S. Temos 


— | — | | XT yY =a 
(a,b) (1,3) t y(1,4) (x T y, 3x 1 4y) ou 3x+4y =b 
Resolvemos em x e y para obter x = 4a — b, y = -3a + b. Assim, 
v= (4a — bju, + (3a +b)u, e [v]s = [(a,b)]s = [4a — b, —3a + b)” 


Usando essa fórmula de [v]; e escrevendo as coordenadas dos e, como colunas, obtemos 


e=(1,0)= 4u; — 3u Q= 4 —1 
e, = (0,1) = -u + do e =j- q 


Método 2 Como Q = P” l encontramos P7!, digamos, usando a fórmula da inversa de matrizes 2 x 2. Assim, 
4 -1 
pa 
(c) Método 1 Escrevemos v como uma combinação linear dos vetores de S, digamos, usando a fórmula de v = (a, b). 


Temos v = (5, —3) = 23u, — 18u, e, portanto, |v]; = 23, —18]". 
Método 2 Pelo Teorema 6.6, podemos usar [v]s = P~! [v]; e [vls = [5, —3] r para obter 


essre [a lls] 


Æ  Árcesra LINEAR 


6.14 Os vetores u; = (1,2,0), u, = (1,3,2), u; = (0, 1,3) formam uma base S de RÊ. Encontre 


(a) a matriz de mudança de base P da base canônica E = {e}, e,, e3} para S. 


(b) Encontre a matriz de mudança de base Q de S de volta para E. 


(a) 


(b) 


110 
Como E é a base canônica, simplesmente escrevemos os vetores da base S como colunas: P= |2 3 1 
02 3) 


Método 1 Escrevemos cada vetor da base E como uma combinação linear dos vetores da base S, calculando as 
coordenadas de um vetor v = (a, b, c) arbitrário em relação à base S. Temos 


a 1 1 0 x+ y =a 
bj =x 2] +r 3| +2z]1 ou 2x+3y+ z=b 
c 0 2 3 2y+32=c 


Resolvemos em x,y, z para obter x = 7a — 3b + c, y = —6a + 3b — c, z = 4a — 2b + c. Assim, 


v = (a,b,c) = (7a — 3b + c)u; + (—6a + 3b — c)u, + (4a — 2b + cJus 


ou [vls = [(a,b,c)]s = [7a — 3b +c, —6a +3b — c, 4a — 2b + e” 

Usando essa fórmula de [v]; e escrevendo as coordenadas dos e, como colunas, obtemos 
e = (1,0,0) = Tuy — 6u ZE 4us 7 —3 
e, = (0,1,0) = —3u, + 3u, — 2u, e 0O=|-6 3 -l 
ey =— (0,0, 1) = uy — UWT Us 4 -2 


Método 2 Encontramos P~! reduzindo M = [P, 1] à forma [, P-M, como segue. 


1 1 0'100 tiatia 
M=|23 110 1 of~]0 1 1122 10 
lo 2 310 0 1 023,001 
[1 01 00 10 0! 7 -3 1 
~ |0 1 1i-2 1 0|-|[0 1 01-6 3 -1| =[,P™"] 
l0 0 1; 4 2 1 001i 4-2 1 
Ta i 
Assim, Q=P! = |=6 3 — 
dad i 


6.15 Suponha que os eixos x e y do plano R? tenham sido girados por 45° no sentido anti-horário, de modo que 
os novos eixos x'e y’ estejam, agora, na posição das retas y = x e y = —x, respectivamente. 


(a) 
(b) 
(a) 


(b) 


Encontre a matriz P de mudança de base. 
Encontre as coordenadas do ponto A(5, 6) com a rotação dada. 
Os vetores unitários na direção dos novos eixos x'e y’ são 
m=(V22V2) e  m=(-5V2,;V2) 


2. š sá . a: A sa Aut 2 : 
(Os vetores unitários na direção dos eixos x e y originais são os vetores da base canônica de R^.) Assim, escrevemos 
as coordenadas de u, e u, como colunas para obter 


Multiplicamos as coordenadas do ponto dado por P”!, como segue. 
lv2 1v2 | 5 | 12 
-1V2 1/0 [16] |1iv2 


(Como P é ortogonal, a inversa P~! é, simplesmente, a transposta de P.) 
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6.16 Os vetores uy = (1,1,0), u, = (0,1,1), us = (1,2,2) formam uma base S de RÊ. Encontre as coordena- 
das de um vetor arbitrário v = (a, b, c) em relação à base S. 


Método 1 Escrevemos v como uma combinação linear de u,, u,, u, usando incógnitas x, y, z. Temos 
(a,b,c) = x(1,1,0) + y(0,1,1) +z(1,2,2) = (x +z, x+y + 2z, y +22) 


que fornece o sistema 


x+ z=a x + z=a x + z=a 
x+y+2z=b ou y+ z=-a+b ou y+z=-—a+b 
y+2z=c y+2z=c z=a-b+c 


Substituindo para trás, obtemos x = b — c, y = —2a + 2b — c,z = a — b + c. Assim, 


[v] = [b —- c, —2a +2b — c, a— b c)” 


Método 2 Encontramos P~! reduzindo M = [P, 1] à forma M, Pp) em que P é a matriz de mudança de base da 
base canônica E para S ou, em outras palavras, a matriz cujas colunas são os vetores da base S. 


Temos 
[1011100 101! 100 
M=|1 1 210 1 Oļ~fO0 1 11-1 1 0 
|o 1 2'0 0 1 012! 001 
[01 1 00 10010 1 -1 
adatira tomo i da was = [1,2] 
jo o 1 111 0 0 1} 1 -l 1 
0 1 -1 0 1 -1]Ta b-c 
Assim, Pli=|-2 2 -1| e [i] =P[];=|-2 2 =-1||b] = |-—2a+2b-c 
1 — 1 1 —1 1 c a—b+c 


6.17 Considere as bases de R? a seguir. 


S = {uu} = {(1,—2), (3,-4)) É S = (vw) = {(1,3), (3,8)) 
(a) Encontre as coordenadas de v = (a, b) em relação à base S. 
(b) Encontre a matriz de mudança de base P de S para S”. 
(c) Encontre as coordenadas de v = (a, b) em relação à base S’. 
(d) Encontre a matriz de mudança de base Q de S’ de volta para S. 
(e) Verifique que Q = P-!. 
(£) Mostre que P'fu] s = [v]s., para qualquer vetor v = (a, b) de R’. (Ver Teorema 6.6.) 


(a) Sejav = xu, + yu,, com incógnitas x e y, ou seja, 


aj l i 3 aii x+3y=a gi x+3y=a 
b| Ea) 77] —4 -2x — 4y =b 2y = 2a +b 
Resolvemos x e y em termos de a e b para obter x = —2a — $b e y = a + }b. Assim, 


(a,b) = (—2a —2)u, + (a +ł4b)u, ou [(ablç=[-2a-2b, a+4b]” 


(b) Usamos a parte (a) para escrever cada vetor v, e v, da base S’ como uma combinação linear dos vetores u, e u, da 
base S, ou seja, 


v = (1,3) = (=2 - 3u, + (1 + = -Fu +3 
v = (3,8) = (—6 — 12)u + (3 + 4)u, = —18u, + 7u 


E ÁLGEBRA LINEAR 


6.18 


6.19 


Então P é a matriz cujas colunas são as coordenadas de v, e v, em relação à base S, ou seja, 


8 i 
5 7 


(c) Sejav = xv, + yv,, com incógnitas escalares x e y, ou seja, 


al dl 3 x+3y=a x+3y=a 
NESHEZH OU axsgy=b -y=b— 3a 


Resolvemos x e y em termos de a e b para obter x = —8a + 3b e y = 3a — b. Assim, 
(a,b) = (—8a + 3b)v, + (3a — b)v, ou [(ably=[-8a+3b, 3a-b] 


(d) Usamos a parte (c) para escrever cada vetor u, e u, da base S$ como uma combinação linear dos vetores v, e v, da 
base S”, ou seja, 


ui = (1, 2) = 8 6)v; | (3 | 2)u, = 14v; | 5v 
us = (3, 4) ={ 24 12)v; - (9 | 4) =o 36v - 13v, 


—14 —36 
5 13 [7 


Escrevemos as coordenadas de u, e u, em relação a S” como colunas para obter Q = | 


o [=14 =36)|-5 -18| fı 0]. 
© gp =| 5 | 5 A E 


(f) Usando as partes (a), (c) e (d), obtemos 


Sejam P a matriz de mudança de base de uma base (u,) para uma base (w,) e Q a matriz de mudança de 
base da base {w,} de volta para a base (u,). Prove que P é invertível e que O = P7 E 


Suponha, para i = 1,2,...,n, que 


Wi = dgu + anu +... + ainun = Dat ) 
E 
e que, para j = 1, 2, ..., n, 
n 
uj = bwi + bpw ++ Dawn = > bW 2) 
k=1 


Sejam A = [a;] e B = [by]. Então P = A” e Q = B". Substituindo (2) em (1), obtemos 


w= E» Ai ( 2 bawe) = D ( 2 aybu) Wk 
= j= 


j=l k=1 


Como (w;) é uma base, >, a;jb;ų = Ô;k, onde ô; é o delta de Kronecker, ou seja, dy = lse i = k e Ôp = 0 se i £ k. 
Suponha que AB = [c,]. Então cy = Ô;. Por isso, AB = I e, portanto, 


QP = B'AT = (AB) = I7 =I 


Assim, Q = P~!. 


Considere uma sequência finita de vetores S = (u,, th, ..., 4). Seja S” a sequência de vetores obtida de S por 
alguma das “operações elementares” a seguir. 


(1) Trocar dois vetores de posição. 
(2) Multiplicar um vetor por um escalar não nulo. 
(3) Somar um múltiplo de um vetor a um outro vetor. 


Mostre que S e S” geram o mesmo subespaço W. Mostre também que S” é linearmente independente se, e só se, S é 
linearmente independente. 


6.20 


6.21 


6.22 
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Observe que, com cada uma das operações, os vetores de S’ são combinações lineares dos vetores de S. Como cada 
operação tem uma inversa do mesmo tipo, cada vetor de S é uma combinação linear dos vetores de S”. Assim, S e 
S” geram o mesmo subespaço W. Além disso, S” é linearmente independente se, e só se, dim W = n, e isso é válido 
se, e só se, S é linearmente independente. 


Sejam A = [a;] e B = [b,] matrizes m x n sobre um corpo K equivalentes por linhas e sejam v,, v,, ..., V, 
vetores quaisquer de um espaço vetorial V sobre K. Dado i = 1,2, ..., m, sejam u, e w; os vetores definidos 
por 

ui = ai Falata + +tamnd e w=bav+bow+ + binn 
Mostre que {u;} e {w,} geram o mesmo subespaço de V. 
Uma “operação elementar” do Problema 6.19 aplicada a (u,) equivale a uma operação elementar com as 
linhas de A. Como A e B são equivalentes por linhas, B pode ser obtida a partir de A com uma sequência 


de operações elementares com as linhas. Logo, (w,) pode ser obtido a partir de (u,) pela correspondente 
sequência de “operações elementares” e, por isso, (u,) e (w,) geram o mesmo subespaço. 


Sejam u,, U), ..., U, Vetores de um espaço vetorial V sobre K e P = [p,] uma matriz quadrada de ordem n 
sobre K. Dado i = 1, 2, ..., n, seja V; = au, + anu +: + ainun- 


(a) Suponha que P seja invertível. Mostre que (u,] e {v;} geram o mesmo subespaço de V. Logo, {u;,} é 
linearmente independente se, e só se, [v,) é linearmente independente. 


(b) Suponha que P seja singular (não invertível). Mostre que (w,) é linearmente dependente. 
(c) Suponha que (v,) seja linearmente independente. Mostre que P é invertível. 


(a) Se P é invertível, é equivalente por linhas à matriz identidade 7. Pelo Problema 6.19, {v,} e (u,) geram o mesmo 
subespaço de V. Assim, um é linearmente independente se, e só se, o outro é linearmente independente. 


(b) Se P não é invertível, é equivalente por linhas a uma matriz com uma linha nula. Isso significa que (v,) gera um 
subespaço que tem um conjunto gerador com menos do que n elementos. Assim, (v,) é linearmente dependente. 


(c) Essa afirmação é uma contraposição da afirmação (b), portanto segue de (b). 


Demonstre o Teorema 6.6. Seja P a matriz de mudança de base de uma base S para uma base S’ de um es- 
paço vetorial V. Então, dado um vetor v € V, qualquer, temos P[vlg = [v]s, e, portanto, P!vls = [vg 
Sejam S = fu, ..,u,jeS = (w,,...,w,), e suponha que, para i = 1,...,n, 


n 
W; = Agt + anu + + Ainun =D Aju; 
j=1 


Então P é a matriz quadrada de ordem n cuja j-ésima linha é 
(aij, aaj; -- - , apj) (1) 
Também suponha que v = kw, + kw, +: + k wn, = DE k;w;.. Então 
[vls = [ki kz, +-+, knl” 2 


Substituindo os w, nesta equação de v, obtemos 


n n n n 
v=f kw = Et Daw) =y (ash) 
i=l izi Njal ; i=l ` 


j=l 


a 


(ayki + azka ++: + anjka Ju; 


S 
II 


Dessa forma, [v]; é o vetor coluna cuja j-ésima entrada é 


ajkai + azk Heet anjka (3) 
Por outro lado, a j-ésima entrada de P[v] s' é obtida multiplicando a j-ésima linha de P por [u] s» OU seja, (1) por (2). Con- 
tudo, o produto de (1) por (2) é (3). Assim, P [u] s € [v]; têm as mesmas entradas. Assim, P [u] s = [o] s'» como queríamos 
mostrar. 


Além disso, a multiplicação da expressão obtida por P7!, fornece P —o) s= P-!P[] s = [og 
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Operadores lineares e mudança de base 


6.23 Considere o operador linear F de R? definido por F (x,y) = (5x — y, 2x + y)e as bases de R? a seguir. 


(a) 


(b) 
(œ) 
(a) 


(b) 


(c) 


6.24 Seja A = | 


E = {e;,e2} = {(1,0), (0,1)} e S = {u, u} = {(1,4), (2,7)} 


Encontre a matriz P de mudança de base de E para S e a matriz Q de mudança de base de § de volta para 
E. 


Encontre a matriz A que representa F na base E. 


Encontre a matriz B que representa F na base S. 


Como E é a base canônica, simplesmente escrevemos os vetores de § como colunas para obter a matriz P de 
mudança de base. Além disso, sabemos que Q = P7! Assim, 


12 —7 2 
=, 5) + RR 
Escrevemos os coeficientes de x e y em F(x,y) = (5x — y, 2x + y) como linhas para obter 
5 —- 
1-2 1] 


Método 1 Encontramos as coordenadas de F(u,) e F(u,) em relação à base S. Isso pode ser feito calculando, 


0=P 


primeiro, as coordenadas de um vetor (a, b) arbitrário de R“ em relação à base S. Temos 


x+2y=a 
e, portanto, 4 


(a,b) = x(1,4) + y(2,7) = (x + 2y, 4x + 7y), simb 


Resolvemos x e y em termos de a e b para obter x = —7a + 2b, y = 4a — b. Então 
(a,b) = (—7a + 2b)u, + (4a — bJu, 
Agora usamos a fórmula de (a, b) para obter 


F(u) = F(1,4) = (1,6) 
F(u) = F(2,7) = (3,11) 


Su = 2u, 
uy + W 


5 1 
e, portanto, B = É l 
Método 2 Pelo Teorema 6.7, temos B = P-!AP. Assim, 
-pei O é 2415 —1||1 2/0 51 
serta o |) 


| Encontre a matriz B que representa o operador linear A em relação à base 


2 
4 -1 


S = {u u} = {[1,3]", [2, 5]"}. [Vimos que A define um operador linear A: R? — R? em relação à base 
canônica E de R°] 


Método 1 Encontramos as coordenadas de A(u,) e A(u,) em relação à base S calculando, primeiro, as coordenadas 
de um vetor [a, b]” arbitrário de R? em relação à base S. Pelo Problema 6.2, 


[a,b]? = (—5a + 2b)uy + (3a — b)u, 
Usando a fórmula de [a, b]”, obtemos 
awl; al- [Pi] = -53a +32 
4 -1]13 1 
e A(u,) = h || [5 = [| = —89u, + 54u, 
4 -1I]L5 3 


Assim, 
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Método 2 Usamos B = P-!AP, onde P é a matriz de mudança de base da base canônica E para S. Para isso, sim- 
plesmente escrevemos os vetores de § como colunas para obter a matriz P de mudança de base e então usamos a 
fórmula de P-!, Dessa forma, 


sm are JE AE JE 2 


3 5]|4 -1 3 -1 32 54 
1 3 1 
6.25 Seja A = |2 5 —4 |. Encontre a matriz B que representa o operador linear A em relação à base 
1 -2 2 


E T T 
S = (u,,u,us+ = {[1, 1,0] ; [0,1,1] ; [1,2,2] } 
[Vimos que A define um operador linear £: R? —> Rºem relação à base canônica E de Rº) 


Método 1 Encontramos as coordenadas de A(u,), A(u,), A(u,) em relação à base S calculando, primeiro, as coorde- 
nadas de um vetor v = [a, b, cf arbitrário de R? em relação à base S. Pelo Problema 6.16, 


[us = (b — cu + (—2a + 2b — cju, + (a — b +ou; 


Usando essa fórmula de [a, b, cI, obtemos 


A(u) = [4,7,-1] = 8u; + 7u, — 5u, Alu) = [4,1,0]" = u, — 6u, + 3u; 
Alu) = [9,4,1]] = 3u; — 11u, + 6u 


Escrevendo os coeficientes de u, U, U, como colunas, obtemos 


8 ji 3 
B= 7 —6 -ll 
=5 3 6 


Método 2 Usamos B = P-!AP, onde P é a matriz de mudança de base da base canônica E para S. A matriz P 
(cujas colunas são, simplesmente, os vetores de S) e P-! foram calculadas no Problema 6.16. Assim, 


o 1 1][i 3/4771 01 8 1 3 
B=Ppl4ap=|-2 2-1|l2 5-4|l112]=|7-6 -il 
LL alli =2 í2||012 -5 3 6 


6.26 Demonstre o Teorema 6.7. Seja P a matriz de mudança de base de uma base S para uma base S” de um espa- 
ço vetorial V. Então, dado um operador linear T qualquer de V, [T] y = P!T]sP. 


Seja v um vetor de V. Então, pelo Teorema 6.6, P[v] s = [u] se, portanto, 
PIT] sPlo]s = PMs = P~ IT(os = [T (v)]y 
Mas [T] [ols = [7(U)]s- Logo, 
a TIsPlvls = [Tools 
Como a aplicação v > [v]g é sobre K”, temos P"![T]sPX = [T] pX, para cada X € K”. Assim, P![TIsP = [T] s» 


como queríamos mostrar. 


Semelhança de matrizes 
: 24 -2 “12 
6.27 Sejam 4 = 5 J e p=; T 
(a) Encontre B = P'AP. (b) Verifique tr(B) = tr(A). (c) Verifique det(B) = det(A). 


(a) Inicialmente calculamos P~! usando a fórmula da inversa de uma matriz 2 x 2. Temos 


4 [21 
Pe 3.1 
2 2 
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Então 


=2 1/14 —2||1 2 25 30 
rea Alo A [8 ts 
> il 6/3 4 -32 15 
(b) tr(4) =4+6 = 10e tr(B) = 25 — 15 = 10. Logo, tr(B) = tr(A). 
(c) det(4) = 24 + 6 = 30 e det (B) = —375 + 405 = 30. Logo, det(B) = det(A). 


6.28 Encontre o traço de cada um dos operadores F de R? do Problema 6.4. 
Calculamos o traço (soma dos elementos diagonais) de qualquer representação matricial de F, por exemplo, a re- 
presentação matricial [F] = [F]; de F em relação à base canônica E, dada no Problema 6.4 


(a) tr(F) =tr([F) =1-5+9=5. 
(b) tr(F) =tr([F]) = 1+3+5=9. 
(co) tr(F) = tr([F]) = 1+4+7 = 12. 


6.29 Escrevamos 4 = B se A for similar a B, ou seja, se existir uma matriz invertível P tal que 4 = P-! BP. Pro- 
ve que x é uma relação de equivalência (nas matrizes quadradas), ou seja, 


(a) AX A, para cada A, (b) Se 4 = B, então B = A. 
(c) Se A x Be B x C,entãoA = C. 
(a) A matriz identidade I é invertível e 17! = I. Como 4 = I7!AI , temos 4 = À. 


(b) Como 4 = B, existe uma matriz P invertível tal que 4 = P-!BP.Logo, B = PAP! = (P7H) 'AP e P~! também 
é invertível. Assim, B = 4. 


(c) Como 4 = B, existe uma matriz P invertível tal que 4 = PBP, e, como B = C, existe uma matriz Q invertível 
tal que B = Q7! CQ. Logo, 
4=P!BP=Po!co)p =(P'oc(oP) = (oP)'c(oP) 


e QP também é invertível. Assim, 4 = C. 


6.30 Seja B uma matriz semelhante a A, digamos, B = P-14P. Demonstre. 
(a) B” = P-14"P, portanto, B” é semelhante a A”. 
(b) f(B) = P-If(A)P, para qualquer polinômio f(x), portanto, f(B) é semelhante a (A). 
(c) B é uma raiz de um polinômio g(x) se, e só se, A é uma raiz de g(x). 


(a) A demonstração é por indução em n. Por hipótese, o resultado é válido para n = 1. Suponha que n > 1 e que o 
resultado seja válido para n — 1. Então 
B” = BB”! = (PAP 4 je PAR 
(b) Suponha que f(x) = a,x” 
(a), obtemos 


++: + ax + ao. Usando a distributividade à esquerda e à direita, bem como a parte 


P!f(A)P = P! (a,A" +--+ aA + agI)P 
= P! (a„A™®)P +- + P~ (a, A)P +P (agl)P 
= a„(P7'A"P) + -- -+ a, (P'AP) + ag(P IP) 
= aB” + -- -+ aB + al = f (B) 
(c) Pela parte (b), g(B) = 0 se, e só se, P™!g(4)P = 0 se, e só se, g(4) = POP! = 0. 


Representação matricial de transformações lineares gerais 


6.31 Seja F: R? — R? a transformação linear definida por F(x, y, z) = (3x + 2y — 4z, x — 5y + 32). 
(a) Encontre a matriz de F nas bases de Rºe Rº dadas a seguir. 


S = wy w2, w3} = ((1,1,1), (1,1,0), (1,0,0)} e S' = (uu) = {(1,3), (2,5)} 
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(b) Verifique o Teorema 6.10, a saber, que a ação de F é preservada pela representação matricial de F. Em 
outras palavras, que, dado v de Rê qualquer, temos [F] ss lvls = [F (vo 
(a) Pelo Problema 6.2, (a, b) = (—5a + 2b)u, + (3a — b)u,. Assim, 


F(wı) = F(1,1,1) = (1,—1) = —7u; + 4u, 
F(w,) = F(, 1,0) = (5, 4) = 33u } 19u, 
F(w3) = F(1,0,0) = (3,1) = —13u, + 8u 


Escrevemos as coordenadas de F(w,), F(w,), F(w,) como colunas para obter 


-7 -33 13 
Flo =| 4 19 J 


(b) Sev = (x, y z), então, pelo Problema 6.5, v = zw, + (y — z)w, + (x — y)w3. Também 
F(v) = (3x + 2y — 4z, x— 5y + 3z) = (—13x — 20y + 262)u, + (8x + 11y — 152)u, 
-13x — 20y + a 
8x + lly — 15z 


Logo bls=(02-52-0" 0 e  POl=] 
PÁ 
Assim, Ff =33 =13 Co |—13x—20p+262] + 
[Fls,'lols = | 4 19 | pó = | 8x + 11y — 15z | = Fols 


6.32 Seja F: R” — R” a transformação linear definida como segue. 
FÒ(X1, X25- -3 Xn) = (ação F H os Copy F aan 00) Gy Et Gana) 
(a) Mostre que as linhas da matriz [F] que representa F em relação às bases canônicas de R” e R” são os 


coeficiente dos x, nos componentes de F(x, ..., x,). 


(b) Encontre a representação matricial de cada uma das transformações lineares seguintes em relação às 
bases canônicas dos R”. 


(à) F:R? —> R? definida por F(x,y) = (3x — y, 2x+4y, 5x-— 6y). 
Gd)  F:Rî — R? definida por F(x,y, s, t) = (3x — 4y + 2s — 5t, 5x+7y-—s-— 2t). 
Gii) F:R? — Rî definida por F(x,y, z) = (2x + 3y — 82, x+y+z, 4x- 5z, 6y). 


(a) Temos 
F(1,0,...,0) = (a11, a215- >- am) dr an = An 
F(0,1,...,0) = (a12, 422,- - - , Am2) e, portanto, [F] = a do An 
F(0, 0, , 1) = (ain Mn, sOn) Ami Am amn 


(b) Pela parte (a), basta olhar para os coeficientes das incógnitas x, y em F(x, y, ...). Assim, 


Foa 2 3 A 
: i 3 —4 2- -=5 TE 11 1 
(i) [F] i : E: , (ii) [F] a 5 7 =] =9 $ (iii) [F] ii 4 0 = 
0 6 0 
; 2 5 -=3 ; : Er di 3 Dr a 
6.33 Seja 4 = 1 4 7 . Vimos que A determina uma transformação linear F: R? — R^ definida por 


F(v) = Av, em que os vetores são escritos como colunas. Encontre a matriz [F] que representa a transforma- 
ção em relação às bases de Rº e R? dadas a seguir. 


(a) As bases canônicas de R? e R°. 
(b) S = (Wi, Wa, w3} = t(, 1, 1), (1, 1,0), (1,0,0)Je S = {uu} {(1,3), (2,5)}. 
(a) Em relação às bases canônicas, [F] é a matriz A. 


(b) Pelo Problema 6.2, (a, b) = (—5a + 2b)u, + (3a — b)u,. Assim, 
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6.34 


6.35 


6.36 


1 
2 5 3 [4 
Fla aba nm 
o! 
1] 
2 5 -3 7 
Po | a al S hala A 
L ol | 
1] 
2 5 -3 2 
F(w;3) = 4 7 0| = 1 = Su, + 5u, 
L gl 4 


Escrevendo as coordenadas de F(w,), F(w,), F(w,) como colunas, obtemos [F] = 


—12 —41 -8 
8 24 5 


Considere a transformação linear T de R? definida por T(x, y) = (2x — 3y, x + 4y) e as bases de R? a 
seguir. 


E = tee) = {(1,0), (0,1)) È S = uu) = {(1,3), (2,5)) 
(a) Encontre a matriz A que representa T nas bases E e S. 
(b) Encontre a matriz B que representa T nas bases S e E. 


(Podemos interpretar T como uma transformação linear de um espaço em outro, cada um com sua base.) 
(a) Pelo Problema 6.2, (a, b) = (—5a + 2b)u, + (3a — b)u,. Logo, 


T(e)=T(L,0)=(21) =-8m+ Su NE 23 

The) = T(0,1) = (3,4) = 23u — 13u, SP A 5 _13 
(b) Temos 

T(u) = T(1,3) = (7,13) = —7e; + 13e, f= 

Thu) = T(2,5) = (11,22) = —1le; +22e, © Portanto, B= | 43 22 


Qual é a relação entre as matrizes A e B do Problema 6.34? 


Pelo Teorema 6.12, as matrizes A e B são equivalentes, ou seja, existem matrizes P e Q não singulares tais que 
— 0-! Ê í 
B = Q` AP, sendo P a matriz de mudança de base de S para E e Q a matriz de mudança de base de E para S. Assim, 


poli? [5 2 a fla 
REA ao Ro; E a 
4 1 2][-8 -23][1 2 =7 =] 
e QTAP= — =B 
3 5 5 —13]13 5 13 22 
Demonstre o Teorema 6.14. Seja F: V — U uma transformação linear, digamos, com pos(F) = r. Então 


existem bases de V e de U tais que a representação matricial de F é da forma seguinte, em que Z, é a matriz 
identidade de ordem r. 


ap O 
0 0 
Sejam dim V = me dim U = n. Sejam W o núcleo de F e U’ a imagem de F. É dado que pos(F) = r. Logo, a dimensão 
do núcleo de F é m — r. Tomando uma base (w,,...,W,-, + do núcleo de F, estendemos essa base a uma base de V, 
como segue. 
Does Ua Wipes Way) 


Sejam um =F (u) w=F(w), ...,u=F(v,) 
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Então (u,. ..., u,) é uma base de U', a imagem de F. Estendemos essa base a uma base de U, digamos, 


Lys secs Upa ee ra Up 


Observe que 


F(v,)) =u = lu, + 0u, +--+ + 0u, +0Ou,, Ou, 
F(v) =u = 0u + lu ++: + 0u, + Ou +e Ou, 
F(v,) =u, = 0u; + 0u, +--+ + lu, + Ou, + Ou, 
F(w) =0 = 0u + 0u, Ou, + Ou, +- + Ou, 
F(wm-r) =0 = Ou, + Ou, Ou, + Ou, ,1 + + Ou, 


Assim, a matriz de F nessas bases tem o formato exigido. 


Problemas Complementares 


Matrizes e operadores lineares 
6.37 Seja F: R? — R? definido por F(x,y) = (4x + 5y, 2x — y). 
(a) Encontre a matriz A que representa F na base canônica E. 
(b) Encontre a matriz B que representa F na base S = (u,,u,+ = ((1,4), (2,9). 
(c) Encontre P tal que B = P'AP. 
(d) Parav = (a, b), encontre [v]; e [F(v)],. Verifique que [Fl slv]; = [F(v)]s. 


6.38 Seja A: R? — R? definido pela matriz 4 = E al 


(a) Encontre a matriz B que representa A em relação à base S = (m,,u,) = ((1,3), (2,8)+. (Lembre que A 


representa um operador em relação à base canônica E.) 


(b) Parav = (a, b), encontre [v]; e [A(v)]s. 


6.39 Para cada operador L de R? dado, encontre a matriz A que representa L (em relação à base canônica de R?). 
(a) Léa rotação de R? no sentido anti-horário por 45º. 
(b) Lé a reflexão de R? em torno da reta y=x. 
(c) Lé definido por L(1,0) = (3, 5)e L(0,1) = (7, —2). 
(d) L é definido por L(1,1) = (3,7)e L(1,2) = (5, —4). 


6.40 Encontre a representação matricial de cada operador T de R? dado em relação à base canônica de Rº 
(a) T(6,y,2) = (,7,0). (6) Tœ, yz) = (z, y +z, x + +z). 
(c) T(x,y,z) = (2x — 7y — 4z, 3x+y+4z, 6x — 8y +z). 


6.41 Repita o Problema 6.40 usando a base S = {u;, u2, u3} = {(1,1,0), (1,2,3), (1,3,5)}. 


6.42 Seja L o operador de R? definido por 
1(1,0,0) = (1,1,1), 1(0,1,0) = (1,3,5), L(0,0, 1) = (2,2,2) 
(a) Encontre a matriz A que representa L em relação à base canônica E. 


(b) Encontre a matriz B que representa L em relação à base S do Problema 6.41. 


6.43 Seja D o operador derivada, ou seja, D(f(t)) = df/dt. Cada um dos conjuntos a seguir é uma base de um espaço vetorial 
V de funções. Encontre a representação matricial de D em cada base. 


(a) Le! et, te”). (b) (l,t,sen3t,cos3t)h. (0) ft, Pe). 
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6.44 


6.45 


6.46 


Seja D o operador derivada do espaço vetorial V de funções de base S = (sen 0, cos 0). 


(a) Encontre a matriz A = [D],. (b) Use A para mostrar que D é um zero de f (t) = pop 
Seja Vo espaço vetorial das matrizes 2 x 2. Considere a matriz M a seguir e a base canônica E de V. 


m=[2 4) e elo oblo ob [vo [5 1]) 


Encontre a representação matricial de cada um dos operadores T de V a seguir em relação a E. 


(DTUA=MA, (DIA=AM (OTA=MA-AM. 


Sejam 1, e 0, os operadores identidade e nulo, respectivamente, de um espaço vetorial V. Mostre que, dada qualquer 
base S de V, (a) [ly]; = Z, a matriz identidade, (b) [0]; = 0, a matriz nula. 


Mudança de base 


6.47 


6.48 


6.49 


6.50 


6.51 


Encontre a matriz P de mudança de base da base canônica E de R? para a base S, a matriz Q de mudança de base de S 
de volta para E e as coordenadas de v = (a, b) em relação a S, nos casos dados a seguir. 


(a) s= 101,2), (3,5)}. (0) S= {(2,5), (3,7)}- 
b) S= {(1, —3), (3, —8)}. (d) S= {(2,3), (4,5)}. 


Considere as bases S = {(1,2), (2,3)}e S! = {(1,3), (1,4)}de R?. Encontre a matriz de mudança de base 
(a) P de S paras”. (b) Q de S’ de volta para S. 


Suponha que os eixos x e y do plano R? tenham sido girados por 30° no sentido anti-horário para formar novos eixos x! 
e y’ do plano. Encontre 


(a) os vetores unitários na direção dos novos eixos x'e y’, 
(b) a matriz P de mudança de base para o novo sistema, 


(b) as novas coordenadas dos pontos A(1, 3), B(2, —5), C(a, b). 


Encontre a matriz P de mudança de base da base canônica E de R? para a base S, a matriz Q de mudança de base de S 
de volta para E e as coordenadas de v = (a, b, c) em relação a S, nos casos de § dados a seguir. 


(a) u =(1,1,0),u, = (0,1,2), u; = (0,1,1). 
(6) u = (1,0,1), u = (1,1,2), u; = (1,2,4). 
(c) ui = (1,2,1), u, = (1,3,4), u3 = (2,5,6). 


Suponha que S,, S,, S, sejam bases de V. Sejam P e Q as matrizes de mudança de base, respectivamente, de S, para S, e 
de S, para S}. Prove que PQ é a matriz de mudança de base de S, para S}. 


Operadores lineares e mudança de base 


6.52 


6.53 


Considere o operador linear de R? definido por F(x,y) = (5x +y, 3x — 2y) e as bases de R? a seguir. 
S= {(1,2), (2,3) e S=(1,3), (1,4)} 

(a) Encontre a matriz A que representa F em relação à base S. 

(b) Encontre a matriz B que representa F em relação à base S”. 

(c) Encontre a matriz P de mudança de base de S para S”. 

(d) Qual é a relação entre A e B? 


Seja 4: R? — R? definido pela matriz 4 = . Encontre a matriz B que representa o operador linear A em 


1 -1 
3 2 
relação a cada uma das bases dadas. (a) S = (1,3), (2,5). œS = {(1,3)", (2,9). 
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6.54 Seja F: R? — R? definido por F(x,y) = (x — 3y, 2x — 4y). Encontre a matriz A que representa F em relação a cada 
uma das bases dadas. (a) S = ((2,5), (3,7)}. (bS= (2,3), (4,5). 


1 
6.55 Seja A: R? — R? definido pela matriz 4 = | 2 . Encontre a matriz B que representa o operador linear A em 
1 


relação à base S = {(1, 1,1)”, (0,1,1), (1,2, je 


Semelhança de matrizes 
. al l al =2 
6.56 Sejam 4 = É sp? = Ê E 
(a) Encontre B = PAP, (b) Verifique tr(B) = tr(A). (c) Verifique det(B) = det(A). 


6.57 Encontre o traço e o determinante de cada um dos operadores de R? dados. 
(a) F(x,y) = (2x — 3y, 5x + 4y). (b) G(x,y) = (ax + by, cx+ dy). 


6.58 Encontre o traço e o determinante de cada um dos operadores de Rº dados. 
(a) F(x,y,2) = (x +3y, 3x — 2z, x— 4y — 32). 
(b) G(x,y,2) = (y +3z, 2x — 4z, 5x + 7y). 


6.59 Sejam S = (u,, u,) uma base de Ve T: V — V o operador definido por T(u,) = 3u; — 2u, e T(u,) = u, + 4u,. Seja 
S' = {w;, w; } a base de V dada por w; =u + u ẹ Wz = 2u; + 3u. 


(a) Encontre as matrizes A e B que representam T em relação às bases S e S”, respectivamente. 


(b) Encontre a matriz P tal que B = PAP. 


6.60 Seja A uma matriz 2 x 2 tal que somente A é semelhante a A. Mostre que A é uma matriz escalar, ou seja, A = Į a ; 


6.61 Mostre que todas as matrizes semelhantes a uma matriz invertível são invertíveis. Mais geralmente, mostre que matrizes 
semelhantes têm o mesmo posto. 


Representação matricial de transformações lineares gerais 
6.62 Encontre a representação matricial de cada uma das transformações lineares em relação às bases canônicas dos R”. 
(a) F:R? — R?, definida por F (x,y,z) = (2x — 4y + 9z, 5x + 3y — 27). 
(b) F:R? — Rº, definida por F(x,y) = (3x + 4y, 5x — 2y, x+ 7y, 4x). 


(c) F:Rº > R, definida por F (x1, x3, X3, X4) = 2x1 + x, — 7x3 — x4. 


6.63 Seja G: R? — R? definida por G(x, y, z) = (2x + 3y — z, 4x — y + 2z). 
(a) Encontre a matriz A que representa G em relação às bases 
S=((1,1,0), (1,2,3), (1,3,5)) e S = ((1,2), (2,3)! 
(b) Parav = (a, b, c) de Rº, encontre [vu], e[G(v)lg. (c) Verifique que Afvs = [G(v)] y- 


6.64 Seja H: R? — R? definida por H(x,y) = (2x + 7y, x — 3y) e considere as bases de R? a seguir. 
S= {(1,1), (1,2)} e S' = {(1,4), (1,5)} 


(a) Encontre a matriz A que representa H em relação às bases Se S”. 


(b) Encontre a matriz B que representa H em relação às bases S'e S. 
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6.65 Seja F: R? — R? definido por F(x,y, z) = (2x +y —z, 3x -— 2y + 4z). 


(a) Encontre a matriz A que representa F em relação às bases 
S = {(1,1,1), (1,1,0), (1,0,0)} e S' = (1,3), (1,4)} 


(b) Verifique que A[v]; = [F(v)]s, para qualquer v = (a, b, c) de R? 


6.66 Sejam S e S” bases de V e seja 1, a transformação identidade de V. Mostre que a matriz A que representa 1, em relação 
às bases S e S’ é a inversa da matriz P de mudança de base de S para S’, ou seja, 4 = P-1. 


6.67 Demonstre os Teoremas (a) 6.10, (b) 6.11, (c) 6.12, (d) 6.13. [Sugestão: ver as demonstrações análogas dos Teoremas 
6.1, 6.2, 6.3 e 6.7 nos Problemas 6.9, 6.10, 6.11 e 6.26, respectivamente.] 


Problemas variados 
6.68 Suponha que F: V — V seja linear. Dizemos que um subespaço W de V é invariante por F se F(W) C W.Suponha que 
W seja invariante por F e que dim W = r. Mostre que F tem uma representação em matriz triangular superior em blocos 


A B | em que A é uma submatriz quadrada de ordem r. 


n=[9 é 


6.69 Suponha que V = U + We que U e W sejam, ambos, invariantes por um operador linear F: V — V. Suponha, também, 


que dim U = re que dim W = s. Mostre que F tem uma representação matricial M = 


0 z 
, em que A e B são sub- 
matrizes quadradas de ordens r e s, respectivamente. 


E 


6.70 Dizemos que dois operadores lineares F e G de V são semelhantes se existir um operador linear invertível T de V tal que 
G = T7! o F o T. Prove as afirmações seguintes. 


(a) F e G são semelhantes se, e só se, as matrizes [F]; e [G]; são semelhantes, para qualquer base S de V. 


(b) Se F é diagonalizável (ou seja, semelhante a uma matriz diagonal), então qualquer matriz G semelhante a F 
também é diagonalizável. 


Respostas dos Problemas Complementares 


Notação: M = |R; R; ..-.]denota uma matriz M de linhas R,, R,, ... 


6.37 (a) 4=[4,5; 2,—1]; (b) B=[220,487; -98,-217; (o) P=[1,2; 4,9; 
(d) [vls = [9a 2b, —4a+b]” e [F(v)]s = [32a +47b, —14a — 21b)” 


6.38 (a) B=[-6,-28; 4,15]; 
(b) [uls = [4a b, -2a +}b]" e [A(v)]s = [18a — 8b, +(—13a + 7b)] 


6.39 (a) [v2,-v2; v2, v2]; Œ) [0,1; 1,0; (oO) B7 5,-2]; 
(d) [1,2; 18,—11] 


6.40 (a) [1,0,0; 0,1,0; 0,0,0]; (b) 10,0,1; 0,1,1; 1,1,1]; 
(c) 2,—7,-4; 3,1,4; 6, 8,1] 


6.41 (a) 13,5; 0,—5,—10; 0,3,6]; (b) [0,1,2; -1,2,3; 1,0,0]; 
(e) [15,65,104; —49,—219,—351; 29,130,208] 


6.42 (a) [1,1,2; 1,3,2; 1,5,2]; (b) [0; 2,14,22; 0,-5,-8] 


6.43 (a) [I 
(co) 15, 


0,0,2]; (œ) [0,1,0,0; 0; 0,0,0,-3; 0,0,3,0]; 
0,0,5 
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6.44 (a) 4=[0,-1; 1,0); (b) 42+1=0 


6.45 (a) [a,0,b,0; 0,4,0,b; c,0,d,0; 0,c,0,d]; 
(b) a,c,0,0; b,d,0,0; 0,0,a,c; 0, Db, d]; 
(c) [0,-c,b,0; —-ba-d,0,b; cO0,d-a,-c; 0,c,—b,0] 

647 (a) [1,3; 2,5) [-5,3; 2,-1], [=[-5a+3b, 2a]; 
(b) [1,3; -3,-8]), [-8,-3; 3,1) [v=[-8a-3b, 3a+5]; 
(o) 3; 5,7] [-23 S-20;  lu=[-70+3b, 5a- 2b]; 
(d) 2,4; 3:5]; [-5,2; 2,1), [v] = [-3a + 2b, ja — b] 


648 (a) P=[3,5; -1,-2)) 6) 0=[2,5; —1,-3] 


(a) 1(K, 1), ł(—1,K); 
(b) P=Ż+}[K,-1; LK]; 
(c) HK +3,3K-1],  lpk-5,-5K-2, taK +pb,bK — a] 
6.50 P é a matriz cujas colunas são u4 , u2, u3, Q = P7!, [v] = Ola, b, cf. 
(a) Q=[1,0,0; 1,—1,1; —2,2,—1], [v] =a, a-b+c, 2a + 2b c|”; 
(b) 0=[0,-2,1; 2,3,—2; —1,-1,1], [v|=[-2b+c, 2a+3b-2c, -a-b+c]: 
(0) 0=[-2,2,-1; 7,4,—-1; 5,-3,1], [u] = [-2a +2b—- c, —Ta+4b-c, 5a — 3b + c|” 


6.52 (a) [-23,-39; 15,26; Œ [5,41; -27,-32]; (o) [,5; —1,-2]; (d) B=P'AP 
6.53 (@) [28,47; —15,-25]; Œ [13,18; —15,-10) 

6.54 (a) [43,60; —33,-46]; (œ) 13,7; —5,-9] 

6.55 [10,8,20; 13,11,28; —5,—4,—10] 

6.56 (a) [-34,57; —19,32]; (b) tr(B) = tr(4) = —2; (c) det(B) = det(4) = —5 

6.57 (a) tr(F) = 6,det(F) = 23; (b) tr(G) = a+d,det(G) = ad — be 

6.58 (a) tr(F) = —2, det(F) = 13; (b) tr(G)=0, det(G) = 22 

6.59 (a) 4=[3,1; —2,4], B=[8,11; —2,-1); (b) P=[1,2; 1,3] 


6.62 (a) [2,-4,9: 5,3,-2]; (b) [3,5,1,4; 4,-2,7,0]; (co) [2,1,-7,-1] 


6.63 (a) [-9,1,4; 7,21]; () [vlg=[[a+2b-c, Sa-5b+2c, -3a+3b-c, e 
[ Za-Wb+7, 7b- 4c]" 


Q 
A 
= 
= 
g 

I 


6.64 (a) 4=[47,85; —38,—69]; (b) B=[71,88; —41,-51] 


6.65 A = [3,11,5; —1,-8,-3] 


Espaços com Produto 
Interno, Ortogonalidade 


7.1 INTRODUÇÃO 


A definição de um espaço vetorial V envolve um corpo arbitrário K. Neste capítulo restringimos K ao corpo real R, 
caso em que V é dito espaço vetorial real; nas últimas seções deste capítulo estendemos nossos resultados para o 
caso em que K é o corpo complexo C, caso em que dizemos que V é um espaço vetorial complexo. Também conti- 
nuamos com nossa notação, na qual 


u, v, w são vetores de V 
a, b, c, k, r são escalares de K 


Além disso, os espaços vetoriais V deste capítulo têm dimensão finita, salvo menção explícita em contrário. 

Observe que os conceitos de “comprimento” e “ortogonalidade” não apareceram na investigação de espaços 
vetoriais arbitrários V (embora tenham aparecido na Seção 1.4 sobre os espaços R” e C”). Agora acrescentamos 
uma estrutura adicional a um espaço vetorial V para obter um espaço com produto interno e, nesse contexto, aque- 
les conceitos estão definidos. 


7.2 ESPAÇOS COM PRODUTO INTERNO 


Começamos com uma definição. 


DEFINIÇÃO Seja V um espaço vetorial real. Suponha que a cada par de vetores u, v € V esteja associado um 
número real, denotado por (u, v). Essa função é denominada produto interno (real) de V se satisfizer os axiomas 
seguintes. 


[[ |] (Linearidade) (au, + bu, v) = a(u,,v) + b(u,, v). 
[L] (Simetria) (u, v) = (v, u). 
[L] (Positividade) (u, u) > 0.; e (u, u) = 0 se, e só se, u = 0. 


O espaço vetorial V com um produto interno é denominado espaço com produto interno (real). 


O axioma [I,] afirma que uma função produto interno é linear na primeira posição. Usando [I] e o axioma da 
simetria [I,], obtemos 


(u, cv +dw)=(coy+dv, u) = cv, u) + dlo, u) = clu, vi) + dlu, v) 


Isto é, a função produto interno também é linear na segunda posição. Combinando essas duas propriedades e usan- 
do indução, obtemos a fórmula geral seguinte. 


(Dam, Db) = 3 do ab; (us, v;) 
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Isso significa que o produto interno de uma combinação linear de vetores é igual à combinação linear dos produtos 
internos dos vetores. 


Exemplo 7.1 Seja V um espaço com produto interno real. Então, por linearidade, 
(3u E 4u, 2v = Sv, + 6v3) = 6(u,, vi) E 15(u;, v) + 18(m,, v3) 
— 8(u2, v1) + 20(145, v2) — 24(u, 05) 
(2u — 5v, 4u + 6v) = 8(u,u) + 12(u,v) — 20(v,u) — 30(v, v) 
= 8(u,u) — 8(v,u) — 30(v,v) 


Observe que, na última equação, usamos a simetria, que (u, v) = (v, u). 


OBSERVAÇÃO O axioma [I] sozinho implica (0,0) = (00,0) = 0(v,0) = 0. Assim, [I,], [L] e [L] são equiva- 
lentes a [I,] e [L] juntos com o axioma seguinte. 


[6] Se u 0, então (u, uY é positivo. 


Ou seja, uma função que satisfaz [I,], [L] e [15] é um produto interno. 


Norma de um vetor 


Pelo terceiro axioma [L] de um produto interno, (u, u} é não negativo, para qualquer vetor u e, portanto, existe a 
raiz quadrada não negativa desse valor. Usamos a notação 


ul = y (u, u) 
Esse número não negativo é denominado norma ou comprimento de u. A relação |u||” = (u, u) é muito utilizada. 


OBSERVAÇÃO Se ||u|| = lou, equivalentemente, se (u, u) = 1, dizemos que u é um vetor unitário e que o vetor 
está normalizado. Um vetor não nulo v qualquer de V pode ser multiplicado pelo recíproco de seu comprimento 
para obter o vetor unitário 


1 


V=-"—u 
lloll 


que é um múltiplo positivo de v. Esse processo é denominado normalização de v. 


7.3 EXEMPLOS DE ESPAÇOS COM PRODUTO INTERNO 


Nesta seção listamos os principais exemplos de espaços com produto interno utilizados neste texto. 


O espaço euclidiano R” 


Considere o espaço vetorial R”. O produto escalar de R” é definido por 
u: v= qb; + ab, +: + a,b 


onde u = (a) e v = (b). Essa função define um produto interno em R”. A norma ||ul] do vetor u = (a) nesse espaço 
é dada a seguir. 


lull = Vu = ya? +a} +--+ a 


Por outro lado, pelo Teorema de Pitágoras, a distância da origem O de Rº ao ponto P(a, b, c) é dada por 
va? + b? + œ. Essa é precisamente igual à norma, acima definida, do vetor v = (a, b, c) de Rº. Como o Teorema 
de Pitágoras é uma consequência dos axiomas da Geometria Euclidiana, o espaço vetorial R” com o produto inter- 
no e a norma dados é denominado espaço euclidiano n-dimensional. Embora existam muitas maneiras de definir 
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produtos internos em R”, vamos sempre supor definido esse produto interno, denominado produto interno canôni- 
co, salvo menção explícita em contrário. 


OBSERVAÇÃO Muitas vezes representamos os vetores de R” como vetores coluna, ou seja, matrizes coluna 
n x l. Nesse caso, a fórmula 


(u,v) = u"v 


define o produto interno canônico de R”. 


Exemplo 7.2 Sejam u = (1, 3, —4, 2), v = (4, -2, 2, 1), w = (5,-1,-2,6) de RÍ. 


(a) Mostre que (3u — 2v, w) = 3(u,w) — 2 (v, w). 
Por definição, 


(u,w) = 5—3 +8 + 12 = 22 e (v, w) = 20 +2 -— 4+6 = 24 
Observe que 3u — 2v = (-5, 13, —16, 4). Assim, 
(3u — 2v, w) = —25 — 13 +32 +24 = 18 


Como era de se esperar, 3 (u, w) — 2(v, w) = 3(22) — 2(24) = 18 = (3u — 2v, w). 


(b) Normalize u ev. 
Por definição, 


lul =vVI+9+16+4=v30 e  Iul=v16+4+4+1=5 


Normalizamos u e v e obtemos vetores unitários nas direções e sentidos de u e v, como segue. 


a ( 1 3 = 2 : 1. q (é =I J 
u = -u= 3 5 ; y= y= : =: 
llull V30 V30 v30 V30 lvl] as 


Espaço funcional C [a, b] e espaço polinomial P(t) 


A notação Cla, b] é usada para denotar o espaço vetorial de todas as funções contínuas no intervalo fechado [a, b], 
isto é, coma < t < b Dadas funções f(t) e g(t) de Cla, b], definimos um produto interno em Cla, b] como segue. 


b 
(1,8) = | FOSO dt 


Esse produto é o produto interno canônico de Cla, b]. 
O espaço vetorial P(t) de todos os polinômios é um subespaço de Cla, b], para qualquer intervalo [a, b] e, 
portanto, o produto interno canônico também é um produto interno em P(t). 


Exemplo 7.3 


Sejam f(t) =3t—5 e g(t) = Ê do espaço polinomial P(A com produto interno 


(ie) = | 1O80 de 


(a) Encontre (f,g). 
Temos f(t)g(t) = 3? — 5Ê, portanto, 


al 1 


(4,8) = [68 -sPjar= 38-30] =3-3=-8 
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(b) Encontre |lf| e ||]. 
Temos [f (H? =f(N)f(t) =92 —-30t+25 e [g(D)P = £. Então 
1 1 
IA =(1,1) = | (9È = 30t +25) dt = 3P = 15º 425% = 13 
0 


0 
1 


2 
lg - (gg) =[ tas 


Assim | f= VT e lgl=/1=1v3. 


Espaço matricial M = M,,, 
Seja M = M,, „ O espaço vetorial de todas as matrizes reais m x n. Um produto interno de M é definido por 
(A, B) = tr(B7A) 
onde, como sempre, tr( ) indica o traço, que é a soma dos elementos diagonais. Se A = [a] e B = [b,], então 
m n 2 m n 
(A,B) = tr(BTA) = 3 Dali e IAI = (4,4) = 3 Dai 
i=lj= i=lj= 


Em outras palavras, (4, B} é a soma dos produtos das entradas correspondentes de A e B e, em particular, (4, 4) é a 
soma dos quadrados das entradas de A. 


Espaço de Hilbert 


Seja V o espaço vetorial de todas as sequências infinitas (a,, a,, 43, ...) de números reais satisfazendo 


0,0) 
D= tho 
i=l 


ou seja, a soma infinita converge. A soma e a multiplicação por escalar em V são definidas componente a compo- 
nente, isto é, se 


u = (dp) e v = (Dj bz,...) 
então u+v= (a; +b, a+b, ...) e ru = (rara...) 


Um produto interno de V é definido por 
(u, v) = aib; + ab +++: 


Dado qualquer par de pontos de V, essa soma converge absolutamente. Por isso, esse produto interno está bem 
definido. Esse espaço com produto interno é denominado espaço l, ou espaço de Hilbert. 


7.4 DESIGUALDADE DE CAUCHY-SCHWARZ, APLICAÇÕES 


A fórmula seguinte (demonstrada no Problema 7.8) é a desigualdade de Cauchy-Schwarz ou desigualdade de 
Schwarz, utilizada em várias áreas da Matemática. 


Teorema 7.1 (Cauchy-Schwarz) Dados vetores u e v quaisquer de um espaço com produto interno V, 
2 
(u,v) <(muto,v) ou [u v) < Juliol 


Vejamos essa desigualdade em casos específicos. 


Exemplo 7.4 


(a) Considere quaisquer números reais a,, ..., à,, bi, ..., D,. Pela desigualdade de Cauchy-Schwarz, 


(ajbi +azb ++ ado)” < (A H H a) ++ dê) 


Ou seja, (u - v)? < |lull llull’, com u = (a) ev = (b). 
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(b) Sejam fe g funções contínuas do intervalo [0, 1]. Então, pela desigualdade de Cauchy-Schwarz, 
2 


[r00 al < [2o af P(t) di 


0 0 0 
Ou seja, LD? < IA ol. Aqui, V é o espaço com produto interno C[0, 1]. 


O próximo teorema (demonstrado no Problema 7.9) fornece propriedades básicas de uma norma. A demons- 
tração da terceira propriedade requer a desigualdade de Cauchy-Schwarz. 


Teorema 7.2 Seja V um espaço com produto interno. Então a norma de V satisfaz as propriedades listadas a seguir. 


NJ lloll > 0; e ||v||= 0 se, e só se, v = 0. 
[N3] [lkol] = [kijo]. 
N3] |lu + vl] < [lull + loll- 


A propriedade [N,] é denominada desigualdade triangular porque, considerando u + v como o lado do triân- 
gulo formado pelos lados u e v (conforme Figura 7-1), então [N,] afirma que o comprimento de um lado de um 
triângulo não pode ser maior do que a soma dos comprimentos dos outros dois lados. 


u 
Desigualdade triangular 


Figura 7-1 


Ângulo entre vetores 


Dados vetores não nulos u e v quaisquer de um espaço com produto interno V, definimos o ângulo entre u e v como 
o ângulo 0 tal que 0 < 0 < me 
(ma) 

llulillel 


cos 0 
A desigualdade de Cauchy-Schwarz fornece —1 < cos 0 < 1, de modo que o ângulo existe e é único. 


Exemplo 7.5 
(a) Considere os vetores u = (2,3,5) ev = (1, — 4,3) em Rº. Então 


tuv=2=12+15=5, lull = V44+9+25 = v38, loll = v1 +16 +9 = v26 


e o ângulo 0 entre u e v é dado por 


cos 0 = 


v38v26 


Observe que 0 é um ângulo agudo, pois cos 0 é positivo. 


(b) Sejam f(t) =3t— 5 e g(t) = Ê do espaço polinomial P(A) com o produto interno (| f, g) = AGO) dt. 
Pelo Exemplo 7.3, temos 


Então o “ângulo” 0 entre fe g é dado por 
SO 55 
(VIDE) 2V5 


Observe que 0 é um ângulo obtuso, pois cos 0 é negativo. 


cos 0 = 
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7.5 ORTOGONALIDADE 
Seja V um espaço com produto interno. Dizemos que os vetores u, v E€ V são ortogonais, ou que u é ortogonal a v, se 
(u,v) = 0 


Essa relação é claramente simétrica, isto é, se u é ortogonal a v, então (v, u) = 0 e, portanto, v é ortogonal a u. Ob- 
servamos que 0 € V é ortogonal a cada v € V, pois 


(0, v} = (0v, v) = 0w, v) = 0 


Reciprocamente, se u é ortogonal a cada v € V, então (u, u) = 0 e, portanto, u = 0 por [L]. Observe que u e v são 
ortogonais se, e só se, cos O = 0, onde 0 é o ângulo entre u e v. Ocorre que isso é verdadeiro se, e só se, u e v são 
“perpendiculares”, ou seja, 0 = 1/2 (ou O = 909). 


Exemplo 7.6 


(a) Considere os vetores u = (1, 1, 1), v = (1,2,-3)ew = (1,-4,3) de Rê. Então 
(u,v)=1+2-3=0, (u,w)=1-44+3=0, (u,w=1-8-9=-16 
Assim, u é ortogonal a v e w, mas v e w não são ortogonais. 
(b) Considere as funções sen t e cos t no espaço vetorial C[-x, x] das funções contínuas do intervalo [—7, z|. Então 


T 
(sent, cost) = | sentcostdt=1 sen? t", =0-0=0 
= 


Assim, sen ź e cos ź são funções ortogonais do espaço vetorial C[-7, n]. 


OBSERVAÇÃO Um vetor w = (x1, X2, . . . ,X„) é ortogonal a u = (a,,a,,...,a,)em R” se 
(u, w) = aix] + aX +-+ + ap,Xn = 0 


Assim, w é ortogonal a u se w satisfaz uma equação homogênea cujos coeficientes são os elementos de u. 


Exemplo 7.7 Encontre um vetor não nulo w que seja ortogonal a u, = (1, 2, 1) eu, = (2, 5, 4) em RÈ. 


Seja w = (x, y, 2). Queremos (u,,w) = 0 e (u,w) = 0. Isso fornece o sistema homogêneo 


x+2y+ z=0 sü x+2y+ z=0 
2x + 5y +4z=0 y+2z=0 


Aqui, z é a única variável livre no sistema escalonado. Tomando z = 1, obtemos y = -2 e x = 3. Assim, (3, —2, 1) 
é um vetor não nulo que é ortogonal a u, e u,. 

Qualquer múltiplo de w também é ortogonal a u, e u,. Normalizando w, obtemos o vetor unitário seguinte que 
é ortogonal a u, e u,. 


sanr (7 TRTA) 


Complemento ortogonal 


Seja S um subconjunto de um espaço com produto interno V. O complemento ortogonal de S, denotado por S+ 
(lê-se “esse perpendicular”) consiste nos vetores de V que são ortogonais a cada vetor u € S, ou seja, 


S+ = {v€ V : (v,u) = 0 para cada u € S} 


E 240 E ENS 


Em particular, dado um vetor u particular de V, temos 
u` =(veV:(u,u)=0) 


ou seja, u% consiste nos vetores de V que são ortogonais ao dado vetor u. 
Mostremos que S+ é um subespaço de V. Claramente, 0 € S L porque 0 é ortogonal a cada vetor de V. Suponha, 


agora, que v, w € $ +. Então, dados escalares a e b quaisquer e um vetor u € S qualquer, temos 
(av + bw, u=a(v,u)+b(w,u)=a-0+b:0=0 

Assim, av + bw € Ste, portanto, S+ é um subespaço de V. 
Enunciamos formalmente esse resultado. 


Proposição 7.3 Seja S um subconjunto de um espaço vetorial V. Então S+ é um subespaço de V. 


OBSERVAÇÃO 1 Seja u um vetor não nulo de Rº. Então há uma interpretação geométrica de ut. Mais precisa- 


mente, u+ é o plano de Rº que passa pela origem O e é perpendicular ao vetor u, conforme Figura 7-2. 


E 


Complemento ortogonal ut 
Figura 7-2 


OBSERVAÇÃO 2 Seja W o espaço solução de um sistema homogêneo AX = 0, em que A = [a;] é uma matriz 
mXneX = [x]. Vimos que W é o núcleo da transformação linear A: R” — R”. Agora podemos dar uma outra 
interpretação para W, usando a noção de ortogonalidade. Mais precisamente, cada vetor solução w = (x,, Xz, ...,X,) 
é ortogonal a cada linha de A, portanto, W é o complemento ortogonal do espaço linha de A. 


Exemplo 7.8 Encontre uma base do subespaço ut de Rº, com u = (1,3, -4). 


Observe que u+ consiste em todos os vetores w = (x, y, zZ) tais que (u, w) = 0, ou x + 3y — 4z = 0. As variáveis 
livres são y e z. 


(1) Tomando y = 1 ez = 0, obtemos a solução w, = (-3, 1, 0). 
(2) Tomando y = 0 e z = 1, obtemos a solução w, = (4,0, 1). 
Os vetores w, e w, formam uma base do espaço solução da equação e, portanto, uma base de u+. 


Seja W um subespaço de V. Então W e W+ são, ambos, subespaços de V. O próximo teorema, cuja demonstra- 
ção (Problema 7.28) requer resultados de seções posteriores, é um resultado fundamental da Álgebra Linear. 


Teorema 7.4 Seja W um subespaço de V. Então V é a soma direta de W e W+, ou seja, V = W o W+. 


7.6 CONJUNTOS ORTOGONAIS E BASES 


Considere um conjunto S = {u}, U, ..., 4,) de vetores não nulos de um espaço com produto interno V. Dizemos que 
S é ortogonal se dois quaisquer dos vetores de S são ortogonais e dizemos que S é ortonormal se S é ortogonal e 
cada vetor de S é unitário. Isto é, 


G) Ortogonal (u;, u;) = 0, comi Æ j 
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0 comi; 


Gi) Ortonormal (u;, u;) = l Meoma 


Normalizar um conjunto ortogonal S se refere ao processo de multiplicar cada vetor de § pelo recíproco de seu 
comprimento e, dessa forma, transformando § num conjunto ortonormal de vetores. 
Temos os seguintes teoremas. 


Teorema 7.5 Ses é um conjunto ortogonal de vetores não nulos, então S é linearmente independente. 


Teorema 7.6 (Pitágoras) Seja (u,, u, ..., u„} um conjunto ortogonal de vetores. Então 
2 2 2 2 
lu + uz +ou E = Wo É + Io ++ ju) 


Esses teoremas são demonstrados nos Problemas 7.15 e 7.16, respectivamente. Aqui, demonstramos o Teorema de 
Pitágoras no caso especial e conhecido de dois vetores. Mais precisamente, suponha que (u, v) = 0. Então 


lu+ vl? = (u+ o, ut v) = (uu) + 2u, v) + (0,0) = (uu) + (0,0) = llul? + lol? 


que dá nosso resultado. 


Exemplo 7.9 
(a) Seja E = (e,,e,,e;) = {(1,0,0), (0,1,0), (0,0, 1)}a base canônica do espaço euclidiano R°. É claro que 
(e1, e2) = (e1,63) = (e2,63) = 0 e (e1,€1) = (e2, e2) = (es,e3) = 1 


Assim, E é uma base ortonormal de R?. Mais geralmente, a base canônica de R” é ortonormal, para cada n. 


(b) Seja V = C[-7,7]o espaço vetorial das funções contínuas no intervalo —7 < t < 7 com o produto interno defi- 
nido por (/,8) = SESO) dr. O conjunto a seguir é um exemplo clássico de conjunto ortogonal de V. 


(1, cost, cos 2t, cos3t,... ,sent,sen2t, sen3t,...) 


Esse conjunto ortogonal desempenha um papel fundamental na teoria das Séries de Fourier. 


Bases ortogonais e combinações lineares, coeficientes de Fourier 
Seja S o conjunto constituído pelos três vetores de R? dados. 


ui = (1,2,1), u, = (2,1, —4), uz = (3, —2, 1) 


O leitor pode verificar que esses vetores são ortogonais, portanto, são linearmente independentes. Assim, S é uma 
base ortogonal de R'. 

Vejamos como escrever v = (7, 1, 9) como uma combinação linear de u,, u,, u}. Primeiro escrevemos v como 
uma combinação linear de u,, u,, u, usando incógnitas x,, x,, X4, como segue. 


V=Xuy + Xz + X3u3 ou (7,1,9) =x, (1,2, 1) +x2(2, 1, —4) + x3 (3, —2, 1) (*) 
Podemos continuar de duas maneiras. 
Método 1 Expandimos (*) (como no Capítulo 3) para obter o sistema 
x + 2x, + 3x3 = 7, 2x, +t — 2x3 = 1, xı — 4x, +x3 =7 


Resolvemos o sistema por eliminação gaussiana para obter x, = 3, x, = —1, x3 = 2. Assim, v = 3u; — u, + 2us. 
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Método 2 (Este método utiliza a ortogonalidade da base, o que simplifica as contas.) Tomando o produto interno 
de cada lado de (*) em relação a u, obtemos 


(ou) = (riu mta tas, u) OU (uu) = (ça) ou = (2 
(ui, Ui) 

Nesse caso, dois termos foram eliminados, porque u, u,, U, é ortogonal. Segue que 
— (vu)  7+2+9 18, _ um) 14 +1-36 21 i 


mu LAFI 6 “ E uu) 4+1+16) 2] 
(vm) 21-249 28 
(us,us) 9+4+1 14 


X3 = 


Assim, novamente, obtemos v = 3u; — us + 2us. 


O procedimento do Método 2 é válido em geral. A saber, temos o teorema a seguir (demonstrado no Problema 
7.17). 


Teorema 7.7 Seja (u,, u,, ..., u,) uma base ortogonal de V. Então, dado qualquer v € V, 


Z (v, u1) u 4 (v, uz) TAE EE (V, Un) u 
(uj, u1) ! (uz, u2) ? (Un, Un) 


(v,u;) 
(ui, U; 


com um coeficiente da série de Fourier de uma função. Esse escalar também tem uma interpretação geométrica, 
discutida a seguir. 


n 


OBSERVAÇÃO O escalar k, = é denominado coeficiente de Fourier de v em relação a u, por analogia 


Projeções 


Seja V um espaço com produto interno. Sejam dados um vetor não nulo w de V e um outro vetor v. Queremos en- 
contrar a “projeção de v sobre w” que, conforme indicado na Figura 7-3(a), será um múltiplo cw de w tal que 
v = v — cw seja ortogonal a w. Isso significa que 


(vu— cw, w) =0 ou (vw)-c(ww)=0 ou c= 


v — proj (v, W) 


(a) 
(b) 


Figura 7-3 


Em vista disso, a projeção de v sobre w é denotada e definida por 


(v, w) 
(w, w) 


proj(v,w) = cw = 


Um tal escalar c é único e é denominado coeficiente de Fourier de v em relação a w, ou então, componente de v ao 
longo de w. 


Esse conceito é generalizado como segue (ver Problema 7.25). 
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Teorema 7.8 Sejam w,, w,, ..., W, vetores ortogonais não nulos de V. Dado um vetor v qualquer de V, denotamos 


v=v-(cwm+om++ew,) 
com 
= (u, wi) ü= (u, w2) E (v, W,) 
(w1, w1) ? (Wo, w2) i ? á (w,, w,) 


Então v’ é ortogonal a w}, W», ..., W 


r 


Observe que cada c, do teorema é o componente (coeficiente de Fourier) de v ao longo do w, dado. 


OBSERVAÇÃO A noção de projeção de um vetor v € V sobre um subespaço W de V é definida como segue. Pelo 
Teorema 7.4, V = W ® w+, Logo, v pode ser escrito, de maneira única, na forma 


v=w+w, com wEW e wewt 


Definimos w como a projeção de v sobre W, denotado por proj(v, W), conforme Figura 7-2(b). Em particular, se W 
= ger(W,, Wz ..., W,), em que os w, formam um conjunto ortogonal, então 


proj(v, W) = C1 W1 + CaWa + +cw, 


em que cada c; é o componente de v ao longo de w, como antes. 


7.7 PROCESSO DE ORTOGONALIZAÇÃO DE GRAM-SCHMIDT 


Seja [v,, v, -.., v,) uma base de um espaço com produto interno V. Podemos usar essa base para construir uma base 
ortogonal {w}, w,, ..., W,) de V como segue. Sejam 


Wi = Vi 
w = v — (v2, w1) wi 
(w1, w1) 
w3 = o (v3, w1) wi (v3, W2) w 
(wi, wi) (wo, W3 
wu (Un, W1) w (Un, W2) w (Un Wn-1) 
E no tww) PO (m,w) À E O dd 
1 1 2 2 n—1 n—1 


Em outras palavras, para k = 2,3, ..., n, definimos 


We = Uk — Cki Wi T Ck2W2 T e — Ck k—1Wk-1 


onde cy; = (vp, W;) / (Wi, W;) É o componente de v, ao longo de w,. Pelo Teorema 7.8, cada w, é ortogonal aos w, que 
o precedem. Assim, w,, W,, ..., W, formam uma base ortogonal de V, como afirmamos. Normalizando cada w,, ob- 
temos uma base ortonormal de V. 

Essa construção é conhecida como processo de ortogonalização de Gram-Schmidt. Convém destacar as obser- 
vações seguintes. 


OBSERVAÇÃO 1 Cada vetor w, é uma combinação linear de v, e dos w, precedentes. Logo, é fácil mostrar, por 
indução, que cada w, é uma combinação linear de v,, v, ...; V, 
OBSERVAÇÃO 2 Tomar múltiplos não nulos de vetores não afeta a ortogonalidade, portanto, em contas à mão, 
pode ser mais simples eliminar as frações em cada novo w, multiplicando-o por um escalar apropriado antes de 
passar ao próximo W41- 
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OBSERVAÇÃO 3 Suponha que u,, u,, ..., u, sejam linearmente independentes, de modo que formam uma base de U = 
ger(u;). Aplicando o processo de ortogonalização de Gram-Schmidt aos vetores u, obtemos uma base ortogonal de U. 


Os teoremas seguintes (demonstrados nos Problemas 7.26 e 7.27) utilizam o algoritmo dado e as observações. 


Teorema 7.9 Seja (v,, v,, ..., v,) uma base qualquer de um espaço com produto interno V. Então existe uma base 
ortonormal (u,, u,, ..., u,) de V tal que a matriz de mudança de base de (v,) para (u,) é triangular, ou seja, para 
k=1,2,..,n, 


Ur = a11 + ak2 Vz Speedo Akk Vk 
Teorema 7.10 Seja S = [w,, wz, ..., W,) uma base ortogonal de um subespaço W de um espaço vetorial V. 


Então S pode ser estendida a uma base ortogonal de V, ou seja, podemos encontrar vetores w,,1,...,W, tais 
que {w];, Wz, ..., W,) seja uma base ortogonal de V. 


Exemplo 7.10 Aplique o processo de ortogonalização de Gram-Schmidt para encontrar uma base ortogonal e, 
depois, uma base ortonormal, do subespaço U de Rº gerado por 


v = (1,1,1,1), v = (1,2,4,5), vs = (1, —3, —4, —2) 


(1) Denotamos w; = v, = (1,1,1,1). 
(2) Calculamos 

12 
(v2, w1) wi =o 
(wi, w1) 


v= 


e denotamos w, = (—2, —1, 1,2). 
(3) Calculamos 


ú (v3, w1) dá (U3, W2) di ia (—8) (—7) 
3 2 = Va 


(wi, wi) ! (w2, w2) 


- (8.17 137 
10 2 6-003) 
Eliminamos as frações para obter w, = (—6, —17, —13, 14). 
Assim, W,, W,, W; forma uma base ortogonal de U. Normalizamos esses vetores para obter uma base ortonor- 
mal (u,, i, uz} de U. Temos will? = 4, ly, ||? = 10, |w;||” = 910, portanto, 


pa 


l 1 


1,1,1,1), w= a2, u, = 
( ) 2 m ) 3 V910 


A (16, —17, —13,14) 


2 


Exemplo 7.11 Seja V o espaço vetorial dos polinômios f(t) com o produto interno ( f, g) = f f(tg(t) dt. Apli- 
que o processo de ortogonalização de Gram-Schmidt a {1, t, Rr) para encontrar uma base ortogonal {f}, ff. fa} 
de P,(t) com coeficientes inteiros. 

Aqui utilizamos que, para r + s = n, 


(1,8) = ndie “a _ [2/(n+1) comnpar 
, 4 n+Il| 0 com n ímpar 
(1) Denotamos f = 1. 
t,1 
(2) Calculamos t = t (1) =t-— 0 = t e denotamos f = t. 


(3) Calculamos 


(2,8) 


(1,2) 


Multiplicamos por 3 para obter $ = 3? = 1. 
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(4) Calculamos 


(?, 32 —1) 
G2-1, 32-1) 


BÊ — 1) 


Multiplicamos por 5 para obter f = 5º — 3t. 
Assim, {1, +, 32 — 1, 5 — 3t} é a base ortogonal procurada. 
OBSERVAÇÃO Normalizando os polinômios do Exemplo 7.11, com p(1) = 1, obtemos os polinômios 
1, t, (32 — 1), 4(5P — 3t) 


Esses são os quatro primeiros polinômios de Legendre, que aparecem no estudo de equações diferenciais. 


7.8 MATRIZES ORTOGONAIS E POSITIVAS 


Nesta seção discutimos dois tipos de matrizes muito especiais no contexto de espaços com produto interno reais V. 
Agora, os vetores de R” são representados por vetores coluna, com o que o produto interno do espaço euclidiano 
(u, v} = uf v passa ser escrito como R”. 


Matrizes ortogonais 


Uma matriz real P é denominada ortogonal se P é não singular e P7! = P7 ou, em outras palavras, se 
PPT = PTP = I. Em primeiro lugar, lembremos (Teorema 2.6) uma caracterização importante dessas matrizes. 


Teorema 7.11 Seja P uma matriz real. São equivalentes as afirmações seguintes. (a) P é ortogonal; (b) as linhas 
de P formam um conjunto ortonormal; (c) as colunas de P formam um conjunto ortonormal. 

(Esse teorema só é válido com o produto interno canônico de R”, não sendo verdadeiro usando algum outro 
produto interno de R”.) 


Exemplo 7.12 


1/03 1/03 1/43 
(a) Seja P = 0 1/vV2_ —1/N2 |. As linhas de P são ortogonais umas às outras e todas são vetores unitá- 
2//6 —1/V6 —1/v6 
rios. Assim, P é uma matriz ortogonal. 
(b) Seja P uma matriz ortogonal 2 x 2. Então, para algum número real 0, temos 


p-| cos 0 E E p= p al 


— sen) cos0 sen — cos 


Os dois teoremas a seguir (demonstrados nos Problemas 7.37 e 7.38) mostram relações importantes entre as 
matrizes ortogonais e as bases ortonormais de um espaço com produto interno real V. 


Teorema 7.12 Sejam E = {e,} e E = {e;} e E' = (e; bases ortonormais de V e P a matriz de mudança de 
base da base E para a base E”. Então P é ortogonal. 


Teorema 7.13 Sejam te,,...,e,) uma base ortonormal de um espaço com produto interno Ve P = [a] uma matriz 
ortogonal. Então os n vetores seguintes formam uma base ortonormal de V. 


, 
ei = 11 + a222 +" + Anin, i=1,2,...5n 
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Matrizes positivas 


Seja A uma matriz real simétrica, isto é, A” = A. Dizemos que A é positiva se, para cada vetor não nulo u de R”, 
(u, Au) = u! Au > 0 


No Capítulo 12 veremos algoritmos que nos permitem decidir se uma matriz dada é positiva, ou não. Contudo, para 
matrizes 2 x 2, temos um critério simples que enunciamos no teorema seguinte (demonstrado no Problema 7.43). 


. PERES a b a bl... f 
Teorema 7.14 Uma matriz real 2 x 2 simétrica Á = . l = | b à] é positiva se, e só se, os elementos 


diagonais a e d são positivos e seu determinante |A| = ad — bc = ad — b? é positivo. 


Exemplo 7.13 Considere as matrizes simétricas seguintes. 


13 1 =2 1 —2 
A não é positiva, pois |4| = 4 — 9 = —5 é negativo. B não é positiva, pois a entrada diagonal —3 é negativa. Contu- 
do, C é positiva, pois seus elementos diagonais 1 e 5 são positivos e seu determinante |C| = 5 — 4 = 1 também é 


positivo. 


Vale o teorema seguinte (demonstrado no Problema 7.44). 


Teorema 7.15 Seja A uma matriz real positiva. Então a função (u, v) = uT Av é um produto interno de R”. 


Representação matricial de um produto interno (opcional) 


O Teorema 7.15 afirma que toda matriz real positiva determina um produto interno de R”. Nesta seção fornecemos 
a recíproca desse resultado. 
Seja V um espaço com produto interno real com base $ = {u}, Uz, ..., U„}. A matriz 


Ae [a;j), com dj = (ui, uj) 


é denominada representação matricial do produto interno de V em relação à base S. 

Observe que A é simétrica, porque o produto interno é simétrico, isto é, (u;, Uj) = (u;, u;). A também depende 
do produto interno de V e da base S de V. Além disso, se S é uma base ortogonal, então A é diagonal e, se S é uma 
base ortonormal, então A é a matriz identidade. 


Exemplo 7.14 Os vetores u, = (1, 1, 0), u, = (1, 2, 3), u, = (1, 3, 5) formam uma base S do espaço euclidiano R°. 
Encontre a matriz A que representa o produto interno de Rº em relação à base S. 


Inicialmente calculamos cada (u;; 4;), obtendo 


(uu) = 1 1 0=2, (u, u) =1+2+0=3, (u, u3) = 1 3 =4 
(u, u) =1+4+9 = 14, (u, u3} = 1 +6 + 15 = 22, (uz, u3} = 1+9 +25 =35 
2 3 4 
Então 4= |3 14 22 |. Como era de se esperar, A é simétrica. 
4 22 35 


Valem os teoremas seguintes (demonstrados nos Problemas 7.45 e 7.46, respectivamente). 


Teorema 7.16 Seja A a representação matricial de um produto interno em relação a uma base S de V. Então, da- 
dos quaisquer vetores u, v € V, temos 


(u, v) = [u]/ Afo) 


onde [u] e [v] denotam os vetores (coluna) de coordenadas em relação à base S. 
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Teorema 7.17 Seja À a representação matricial de algum produto interno de V. Então A é uma matriz positiva. 


7.9 ESPAÇOS COMPLEXOS COM PRODUTO INTERNO 


Nesta seção consideramos espaços vetoriais sobre o corpo complexo C. Inicialmente, relembramos algumas pro- 
priedades dos números complexos (Seção 1.7), especialmente as relações entre um número complexo Z = a + bi, 
com a, b € R, e seu conjugado complexo Z = a — bi, como segue. 


Z=ť +b, Iz| = vV aæ + b?, z +2 =23 +23 ZZ = Z2, Z=2z 


Além disso, z é real se, e só se, Z = Z. 


Temos a definição seguinte. 


DEFINIÇÃO Seja V um espaço vetorial sobre C. Suponha que a cada par de vetores u, v € V esteja associado um 
número complexo, denotado por (u, v). Essa função é denominada produto interno (complexo) de V se satisfizer os 
axiomas seguintes. 
[| (Linearidade) (au, + bu, v) = a(u,,v) + blin, v) 
[3] (Simetria Conjugada) (u, v) = (v, u) 
[3] (Positividade) (u, u) > 0 e (u, u) = 0 se, e só se, u = 0. 
O espaço vetorial V sobre C com um produto interno é denominado espaço com produto interno (complexo). 
Observe que única distinção entre um produto interno real e um complexo é o segundo axioma [7 ]. 
O axioma [1f] da linearidade é equivalente às duas condições 


(a) (u; + i, v) = (u;, v) T (uz, v), (b) (ru, v) = r (u, v) 


Por outro lado, aplicando [Z¥] e [1%], obtemos 


(u,rv) = (rv, u) =r (v, u) =r (v, u) = rlu, v) 


Assim, devemos tomar o conjugado de um número complexo que for retirado da segunda posição de um produto 
interno complexo. De fato (Problema 7.47), o produto interno é conjugado linear na segunda posição, isto é, 


(u, avı + bv) = a(u, v) + blu, v2) 


Combinando a linearidade na primeira posição com a linearidade conjugada da segunda, obtemos, por indução, 
(Zan Saw) = > a;b;(u;, v;) 
i j ij 


Convém destacar as observações seguintes. 


OBSERVAÇÃO 1 O axioma [/f] sozinho implica (0,0) = (0v, 0} = 0(v,0) = 0. Assim, [1], [1%] e [13] são equi- 
valentes a [1%] e [13] juntos com o axioma seguinte. 


[Iž] Seu £ 0, então (u, u) > 0. 


Ou seja, uma função que satisfaz [75], [73] e [7%'] é um produto interno (complexo) de V. 
OBSERVAÇÃO 2 Por [1%], (u,u) = (u, u). Assim, (u, u) sempre é real. Por [1%], (u, u) sempre é não negativo e, 
portanto, existe a raiz quadrada não negativa desse valor. Como no caso de espaços com produto interno real, defi- 
nimos |lu] = (u, u) como a norma ou comprimento de u. 


OBSERVAÇÃO 3 Além da norma, definimos, como antes, os conceitos de ortogonalidade, complemento or- 
togonal e conjuntos ortogonais e ortonormais. Na verdade, as definições de distância, coeficientes de Fourier e 
projeções são idênticas às do caso real. 
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Exemplo 7.15 (Espaço euclidiano complexo C”). Dado V = C”, sejam u = (z) e v = (w) vetores de C”. Então 


(u, v} = Pa = ZW +Z2W + F Zp Wn 


é um produto interno de V, denominado produto interno canônico de C”. Com esse produto interno, dizemos que V 
é o espaço euclidiano complexo. Salvo menção explícita em contrário, vamos sempre supor definido esse produto 
interno em C”. Considerando u e v como vetores coluna, esse produto interno pode 

ser definido por 


(u,v) = u0 


onde, como com matrizes, v significa o conjugado de cada entrada de v. Se u e v são reais, temos w; = w; e, nesse 
caso, o produto interno se reduz ao análogo de R”. 


Exemplo 7.16 


(a) Seja V o espaço vetorial das funções contínuas complexas definidas no intervalo (real) a < t < b. O produto 
interno canônico de V é dado por 


b 


(e= | SOZ di 


a 


(b) Seja U o espaço vetorial das matrizes m x n sobre C. Sejam A = (z,)e B = (w,) elementos de U. O produto 
interno canônico de U é dado por 


(4, B) = tr(B"4) = 5) Y Wyz; 


Como antes, B? = B7, ou seja, B é a matriz conjugada transposta de B. 


A seguir, apresentamos uma lista de teoremas relativos a espaços com produto interno complexos que são 
análogos àqueles do caso real. Aqui, as matrizes hermitianas A (isto é, matrizes tais que Æ” = 47 = 4), desempe- 
nham o mesmo papel que as matrizes simétricas A (isto é, matrizes tais que A” = A) no caso real. (O Teorema 7.18 
é demonstrado no Problema 7.50.) 


Teorema 7.18 (Cauchy-Schwarz) Seja V um espaço com produto interno complexo. Então 


|u, v| < llelo 
Teorema 7.19 Seja W um subespaço de um espaço com produto interno complexo V. Então V = W & W+, 


Teorema 7.20 Suponha que {u}, u,, ..., u„} seja uma base de um espaço com produto interno complexo V. Então, 
dado qualquer v € V, 
v, u v, u V, Un 
ROL p p Lea) y po p (ay 
(u1, u1) (uz, u2) (Un, Un) 


n 


Teorema 7.21 Suponha que (u,, u,, ..., u,) seja uma base de um espaço com produto interno complexo V. Seja A 
= [a;] a matriz complexa definida por a, = (ui, u;). Então, dados quaisquer u, v € V, 


(u, v) = [u] Alo) 


onde [u] e [v] denotam os vetores coluna de coordenadas na base {u;}. (Observação: dizemos que essa matriz A 
representa o produto interno de V.) 


Teorema 7.22 Seja A uma matriz hermitiana (isto é, 4” = 47 = A) tal que XT AX seja real e positivo, para qual- 
quer vetor não nulo X € C”. Então, (u, v} = u! Av é um produto interno de C”. 


Teorema 7.23 Seja A a matriz que representa um produto interno de V. Então A é hermitiana e XT AX é real e 
positivo, para qualquer vetor não nulo X de C”. 
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7.10 ESPAÇOS VETORIAIS NORMADOS (OPCIONAL) 


Começamos com uma definição. 
DEFINIÇÃO Seja V um espaço vetorial real ou complexo. Suponha que a cada v € V esteja associado um número 


real, denotado por |Jv||. Essa função || - || é denominada norma de V se satisfizer os axiomas seguintes. 


[N] Ilol] > 0e Iv] = 0 se, e só se, v = 0. 
[N,] Ilkoll = lk|llol]. 
N3] [lu + vl] < llull + lloll. 


Um espaço vetorial V com uma norma é denominado espaço vetorial normado. 
Seja V um espaço vetorial normado. A distância entre dois vetores u e v de V é denotada e definida por 


d(u, v) = Iu — ull 


O teorema seguinte (demonstrado no Problema 7.56) é a razão principal pela qual dizemos que d(u, v) é a distância 
entre u ev. 


Teorema 7.24 Seja V um espaço vetorial normado. Então a função d(u, v) = |u — v|| satisfaz os três axiomas de 
espaço métrico, como segue. 


IM] d(u, v) > 0e d(u, v) = 0 se, e só se, u = v. 
[M,] d(u, v) = d(v, u). 
IM] d(u, v) < d(u,w) + d(w, v). 
Espaços vetoriais normados e espaços com produto interno 


Seja V é um espaço com produto interno. A norma de um vetor v de V foi definida por 


loll = (0,0) 


Prova-se (Teorema 7.2) que essa norma satisfaz [N,], [N,] e [N,]. Assim, todo espaço com produto interno V é um 
espaço normado. Por outro lado, podem existir normas num espaço vetorial V que não tenham sua origem num 
produto interno de V. 


Normas de R” e C” 


Três normas importantes de R” e C” são definidas como segue. 


(a1; -+ -3 an) llo = max(la;|) 
Ia, san) lh = la| + la| + +++ lanl 


2 2 2 
ar. sal = ylar? + la? +-+- + lay 


(Observe que usamos índices para diferenciar entre essas três normas.) As normas I-l agi || | 1e | l> são denomi- 
nadas, respectivamente, norma infinito, norma 1 e norma 2. Observe que || - ||, é a norma de R” (respectivamente, 
C”) induzida pelo produto interno canônico de R” (respectivamente, C”). Vamos denotar as respectivas funções 
distância por do, dy, do. 


Exemplo 7.17 Considere os vetores u = (1,-5,3) e v = (4,2, —3) de R'. 

(a) A norma infinito escolhe o máximo dentre os valores absolutos das entradas. Logo, 
lullo = 5 e lello = 4 

(b) A norma 1 soma os valores absolutos das entradas. Logo, 


lul =1+5+3=9 e — lelh =4+2+3=9 
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(c) A norma 2 é igual à raiz quadrada da soma dos quadrados das entradas (isto é, a norma induzida pelo produto 
interno canônico de Rô). Assim, 


lull = V1 +25 +9 = v35 e lloll = V16 +4 +9 = v29 


(d) Como u — v = (1 — 4, -5 — 2, 3 + 3) = (-3, —7, 6), temos 


d (u, v) = 7, di(u,v)=3+7+6= 16, do(u,v) = V9 +49 +36 = v94 


Exemplo 7.18 Considere o plano cartesiano R? mostrado na Figura 7-4. 


(a) Seja D, o conjunto dos pontos u = (x, y) de R? tais que ||ul|, = 1. Então D, consiste nos pontos (x, y) tais que 
ul; = x? +7? = 1. Assim, D, é o círculo unitário, conforme Figura 7-4. 


Figura 7-4 
(b) Seja D, o conjunto dos pontos u = (x, y) de R? tais que ||ul|; = 1. Então D, consiste nos pontos (x, y) tais que 
llul = lx] + || = 1. Assim, D, é um quadrado girado inscrito no círculo unitário, conforme Figura 7-4. 


(c) Seja D, o conjunto dos pontos u = (x, y) de R? tais que ||u|| „ = 1. Então D, consiste nos pontos (x, y) tais que 
llull o =max(|x|, ||) = 1. Assim, D, é um quadrado horizontal que circunscreve o círculo unitário, conforme 
Figura 7-4. 


Normas de Cia, b] 


Considere o espaço vetorial V = Cla, b] das funções reais contínuas do intervalo a < t < b. Vimos que um produ- 
to interno de V é dado por 


b 
(1,8) = | FOO dt 
Assim, esse produto interno define uma norma de V = Cla, b] (que é análoga à norma || i Il> de R”), como segue. 


lp = | (OP dt 


a 


Outras normas de V = Cla, b] são 


b 
ly =] Molde œe No = max( 9) 
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As interpretações geométricas dessas duas normas e suas funções distância correspondentes são dadas a seguir. 
A primeira norma é mostrada na Figura 7-5. Aqui, 


fl = área entre a função |f| e o eixo t 


di(f,8) = área entre as funções fe g 


Ro da g0 


(a) || f ||, é a área destacada l 
(b) di(f 8) é a área destacada 


Figura 7-5 


Essa norma é análoga à norma | | ı de R”. 


A segunda norma é mostrada na Figura 7-6. Aqui, 


fls = distância máxima entre fe o eixo t 
d ( f,g) = distância máxima entre fe g 


Essa norma é análoga à norma | - lla de R”. 


JA 
g(t) 


PAU) 


(9) Sl (b) df 9) 


Figura 7-6 


Problemas Resolvidos 


Produtos internos 


7.1 Expanda as expressões dadas. 
(a) (Su, + 8u, 60 — 7v), 
(b) (Ju +5v, 4u — 6v), 
(©) 112u — 3ol 
Use linearidade em ambas posições e, quando possível, a simetria (u, v} = (v, u}. 
(a) Tomamos o produto interno de cada termo à esquerda com cada termo à direita. 
(5u; + 8u, 60, — 7v) = (5u1, 601) + (5u, — 705) + (85,601) + (Buz, —70,) 
= 30 (u, v1) — 35(u,,0,) + 48(u5, v1) — 56(u5, 05) 
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72 


7.3 


7.4 


7.5 


[Observação: confira a semelhança entre essa expansão e a de (5a-8b)(6c-7d ) na Álgebra elementar.] 
(b) (Ju +5v, 4u— 6v) = 12(u,u) — 18(u,v) + 20(v,u) — 30(v, v) 
= 12(u,u) + 2(u, v) — 30 (v, v) 
(©) ||2u— 30| = (2u — 3v, 2u—30) = 4(u,u) — 6(u,0) — 6(v,u) + 9(0,0) 
= 4ljul? — 12(u, v) +9polf 


Considere os vetores u = (1,2,4), v = (2, —3,5), w = (4,2, —3) de Rº. Encontre 

(3) uv, 6) uw (0) vw (d) (u+v)-w, (e) ul, © lel. 

(a) Multiplicamos componentes correspondentes e somamos para obter u -v=2 — 6 + 20 = 16. 
(b) u-w=4+4- 12 = —4. 

(c) v:-w =8-— 6 — 15 = —13. 


(d) Calculamos u + v = (3, —1,9) e, então, (u + v) -w = 12 — 2 — 27 = —17. Alternativamente, usando [I], 
(u+ v):-w=u-w+v:w= —4- 13 = -17. 


(e) Primeiro calculamos Ijul? elevando os componentes de u ao quadrado e somando, como segue. 
lul? = 1? +22 +4? =1+4+16=21, e portanto, ||ul| = v21 


( |lu]? =4+9 +25 = 38e, portanto, ||v|| = v38. 


Verifique que define um produto interno de R’. 
(14,0) =) — X1Y2 — X2V1 + 3X272, com u = (x1,X2), v=(4,)2) 
Argumentamos com matrizes. Podemos escrever (u, v) em notação matricial como segue. 
1 — 
T y 
(uu) =u4o= basal] J | 


Como A é real e simétrica, basta mostrar que A é positiva. Os elementos 1 e 3 da diagonal são positivos e o determinante 
I4|| = 3 — 1 = 2 é positivo. Assim, pelo Teorema 7.14, A é positiva. Por isso, o Teorema 7.15 garante que (u, v} é um 
produto interno. 


Considere os vetoresu = (1,5) e v= (3,4). Encontre 

(a) (u, v) em relação ao produto interno canônico de R°. 

(b) (u, v) em relação ao produto interno de R? do Problema 7.3. 
(c) Iv] usando o produto interno canônico de R°. 

(d) ||v|| usando o produto interno de R? do Problema 7.3. 


(a) (u,v) = 3 + 20 = 23. 
O (uu) =1:3—1:4—-5:3+3:5:4=3-—4-— 15 +60 = 44. 


(c) Iul? = (v, v) = ((3,4), (3,4)) = 9 + 16 = 25e, portanto, Iju|| = 5. 
(a) Ijul? = (0,0) = ((3,4),(3,49)) = 9 — 12 — 12 + 48 = 33e, portanto, ||v|| = v33. 


Considere os polinômios de P(t) a seguir com o produto interno (1,8) = pi t)g(t) dt, 
JŒ) =t+2, s()=3-2, h(0)="-2-3 


(a) Encontre (f,g) e (f,h). 
(b) Encontre || f| e llel 
(c) Normalize fe g. 
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(a) Integramos como segue. 
1 


1 
(e= | C+DG -Das [32 +40-4) = (8428 -44) =—1 
0 0 0 
: t P i 37 
B a + 
(b) = E+E) d=; logo, |IfI = y$ =4v57. 
1 
(g) =| Gr-26-2=1; too lgl=vi=1 
(c) Comol| f || A temos 
f= f= 2 e ê=g=3t-2 
AT a? 
7.6 Encontre 0, sendo 0 o ângulo entre 
(a) u = (1,3, —5,4)e v = (2, —3, 4, 1)em R4. 
[987 “Ti Es e. 
o a= le 5 il e =l; i é | com (4, B) tr(B' A) 
Use cos 0 = da 
Hello!) 
(a) Calculamos 
(u,v)=2-9-204+4=-23, Iu2=1+9+25+16=51, Ilol? =4+9+16+1=30 
Assim, cosh = = = 


5130 3170 
(b) Usamos (A, B ) = tr(B TA) = De La a;jbij, a soma dos produtos das entradas correspondentes. 
(4,B) =9 +16 +21 +24 +25 +24 = 119 
Usamos Iall? = (A,A) = Da DDS 1 ai, a soma dos quadrados de todas as entradas de A. 
IAI? = (4,4) = 92 +82 +72 +62 +52 +42 =271 e portanto, |4|] = V271 
||B||? = (B, B) = 12 +22 +3? +4? +5? +6? =91 e, portanto, IB|=v9 


Assim, cos0 = —— 


7.7 Verifique as igualdades seguintes. 
(a) Lei do paralelogramo (Figura 7-7): |ju + v|? + |lu — vll? = 2]ul? + 2ljol?. 
(b) Forma polar de (u, v) (mostrando que o produto interno pode ser obtido a partir da função norma): 
(u,v) = 4 (llu + vl? — lju — vô). 
Expandimos como segue. 
lu + vl? = (u+ vu + v) = [lull? + 2u, v) + Io? (1) 
lu — vl? = (u = vu — 0) = lul? —2(u, v) + lol? 2) 


Somando (1) com (2), obtemos a lei do paralelogramo (a). Subtraindo (2) de (1), obtemos 


lu + vl? — |lu — v|? = 4u, v) 
Dividindo por 4, obtemos a forma polar (real) (b). 


7.8 Demonstre o Teorema 7.1 (Cauchy-Schwarz). Dados vetores u e v quaisquer de um espaço com produto 
interno real V, (u,u)? < (u,u)(v, v) ou plu, v) < Ifullljul|. 


7.9 
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u+v 


Figura 7-7 


Dado um número real t, 


(u+o tu+ v) =ê(uu)+2Hu,0) + (0,0) = Pu? + 2tlu, 0) + |u? 
Sejam a = |jul?, b = 2(u, v), c = ||v]|?. Como ||tu + v||? > 0, temos 


a? +bt+c>0 


para cada valor de t. Isso significa que o polinômio quadrático não pode ter duas raízes reais, o que implica que 
b? — 4ac < 0 oub? < 4ac. Assim, 


2 2 2 
Hu, v)" < 4lulÉlo 


Dividindo por 4, obtemos nosso resultado. 


Demonstre o Teorema 7.2. A norma de um espaço com produto interno V satisfaz 
(a) [NJI|vl| > 0e Iv] = 0 se, e só se, v = 0. 

(b) Naliko] = kllj. 

© Nle + vi] < Jull + llel 


(a) Se v Æ 0, então (v, v) > 0 e, portanto, ||v|| = y (v, v} > 0. Se v = 0, então (0,0) = 0. Consequentemente, 
0] = vO = 0. Assim, [N,] é válido. 


(b) Temos |kvl2 = (kv, kv) = k? (v, v} = K2||v|P. Tomando a raiz quadrada de ambos lados, resulta [N]. 


(c) Usando a desigualdade de Cauchy-Schwarz, obtemos 


u+ ul? = (u Fo u+ v) = lu, u) + lu, v) + lu, v) + (v, v) 
< lul? + 2ljulilloll + lol? = Meli + lelh? 


Tomando a raiz quadrada de ambos lados, resulta [N;]. 


Ortogonalidade, complementos ortogonais, conjuntos ortogonais 


7.10 Encontre k tal que os vetores u = (1, 2, k, 3) e v = (3, k, 7, —5) de Ri sejam ortogonais. 


7.11 


Calculamos 


(u,v) = (1,2,6,3)-(3,k,7,-5) = 3 + 2k + 7k — 15 = 9k — 12 


Tomando (u, v) = 9k — 12 = 0, obtemos k = 4. 


Seja W o subespaço de Rº gerado por u = (1,2,3,-1,2) e v = (2, 4, 7, 2, —1). Encontre uma base do com- 
plemento ortogonal W+ de W. 
Queremos encontrar todos os vetores w = (x, y, Z, $, f) tais que 
(w, u) = x+2y+3z— s+2t=0 
(w, v) = 2x +4y+7z+2s— t=0 


Eliminando x da segunda equação, obtemos o sistema equivalente 


x+2y+32—-s+2t=0 
z+4s5—5t=0 


7.12 


7.13 


7.14 


7.15 
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As variáveis livres são y, s e t. Logo, 
(1) Tomando y = —1,s = 0,t = 0, obtemos a solução w, = (2, —1,0,0,0). 


(2) Tomando y = 0, s = 1,1 = 0, obtemos a solução w, = (13,0, 4, 1,0). 
(3) Tomando y = 0, s = 0,1 = 1, obtemos a solução w, = (-17,0,5,0, 1). 


O conjunto (w,, w», w,) é uma base de W+. 


Seja w = (1,2,3, 1) um vetor de R4. Encontre uma base ortogonal de ui, 


Tomemos uma solução não nula de x + 2y + 3z + t = 0, digamos, v, = (0,0,1, —3). Agora, tomemos uma solução 
não nula do sistema 


x+2y+3z+t=0, z—3t=0 
digamos, v, = (0, —5, 3, 1). Por último, calculamos uma solução não nula do sistema 
x+2y+3z+t=0, —5y+3z+t=0, z—-3t=0 


digamos, v; = (—14,2,3,1). Assim, v,, v,, v, é uma base ortogonal de w+. 


Seja S o conjunto constituído dos vetores de Rº dados. 
u = (1,1,0,-1), m = (1,2,1,3), u = (1,1,-9,2), uy = (16,-13,1,3) 
(a) Mostre que S é ortogonal e uma base de R?. 


b) Encontre as coordenadas de um vetor v = (a, b, c,d) arbitrário de Rf em relação à base S. 
ç 


(a) Calculamos 


u u, =1+2+0-3=0, uu; =1+1+0-2=0, u; -u4 =16—-13+0-3=0 
u, :u, =1+2-9+6=0, u : u4 = 16 — 26 + 1 +9 = 0, u; -u4 = 16 — 13-9 +6=0 


Assim, S é ortogonal e S é linearmente independente. Por isso, S é uma base de RÍ, já que quaisquer quatro vetores 
linearmente independentes de Rº formam uma base de Rº. 


(b) Como S é ortogonal, basta encontrar os coeficientes de Fourier de v em relação aos vetores da base, como no 
Teorema 7.7 Assim, 


=D o k _ (v3) _a+b-9c+2d 
(u1, u1) 3 i > us) 87 

pa A CRA pa e AR 
(uz, u2) 15 , (ua, U4) 435 


são as coordenadas de v em relação à base S. 


Sejam S, S,, S, subespaços de V. Demonstre as afirmações seguintes. 

(a) SC st. 

(b) Se S; C S, então S> C SŁ. 

(c) St = ger (S) 

(a) Sejaw € S. Então (w, v) = 0, para cada v € S+, portanto, w € SIL Assim, S C S++. 


(b) Seja w € SŁ. Então (w, v) = 0, para cada v € S,. Como S} C S, (w, v) = 0, temos v = S}, para cada v € S,. 
Assim, w € sr e, portanto, S$ C S$. 


(c) Como S C ger(S), a parte (b) fornece ger(S)” C S+. Suponhaqueu E S+ e v €ger(S). Então existem w, w, ..., W, 


em S tais que v = ayw, + a,w, + - - - + ayw,. Usando u € S+, temos 
(u, v) = (u, am + aw, ++: + awg) = a (U, W1) + az (u, W2) +*+: + ap (U, Wg) 
= a, (0) +a (0) +--+ a(0)=0 


Assim, u € ger (8). Segue que S+ C ger(S). Ambas inclusões fornecem S+ = ger(S). 


Demonstre o Teorema 7.5. Se S é um conjunto ortogonal de vetores não nulos, então S é linearmente inde- 
pendente. 


Suponha que S = {u}, u, ..., ,) e que 


DD ÁLGEBRA LINEAR 


aju + azu +: + a,u, = 0 (1) 
Tomando o produto interno de (1) com u,, 


0=(0,m)=(am+am+--+au, um) 
= a; (u, u) + az (uz, U1) ++ a(u,,u) 
=a (u, u) +a: 0+- +a, 0 = a (u, u) 


Como u, Æ 0, resulta (u z u) * 0e, assim, a, = 0. Analogamente, para i = 2, ..., n, tomando o produto interno de (1) 
com u, 


0 = (0, u) = (au; E + a,u, u;) 
=atm,u)++adu,u)++alu,u;) = A; (Uh, Ui) 


Mas (u;, u;) + 0 e, portanto, cada a, = 0. Assim, S é linearmente independente. 
7.16 Demonstre o Teorema 7.6 (Pitágoras). Seja (u,, u,, ..., u,) um conjunto ortogonal de vetores. Então 


2 2 2 2 
uy + u ++ lE = Male + IE ++ lu, |] 


Expandindo o produto interno, obtemos 


lu +i + Hl? = (u Hi HH up u Hi H u) 
= (u1, U1) + (uz, u2) mrri (up, Up) a dit) 
A 
O teorema decorre observando que (u,, u) = PAK e (u,u;) = 0, parai £ j. 


7.17 Demonstre o Teorema 7.7. Seja (u,, u,, ..., U,} uma base ortogonal de V. Então, dado qualquer v € V, 


(v, u) | (v, u) | | (v, Un) 
= uy + us + eee Un 
(u; u) (uz, u2) (Un, Un) 
Suponha que v = kju; + ku, + -+ + k, up. Tomando o produto interno de ambos lados com u,, obtemos 


(v, u) = (ku, + hou, + + kpin, U1) 
= kı (u1, u1) + ko (uz, u1) +: + ka (Uns 41) 
= k (m,w) +k 0+- t ka: 0 = ț ki (u, u) 


(v, u) 


Assim, kj = . Analogamente, para i = 2, ..., n, 


(u1, u) 
(v, Ui) = (kyu; T ku ae kpn, Ui) 
=k (uy, ui) T k, (uz, u) dp pedi te Kg (Um, Ui) 
=k: 0+: + kifu tu) ++ ka O = k (ui, u) 
Assim, k; = (ou) . Substituindo essa expressão no lugar de k, na equação v = ku, ++- + k,u,, obtemos o resultado. 


(ur, ui; 


7.18 Seja {e}, e,, ..., e,) uma base ortonormal de V. Demonstre. 
(a) Dado qualquer u € V, temos u = (u,ej)e; + (u,es)Jes +- + (u,e,)e,- 
(b) (me HiH apen, bies +i bren) = abi +ab, ++ ah. 
(c) Dados quaisquer u, v € V, temos (u, v) = (u, e1) (v, e1) + ---+ (u, e) (0, ep). 


(a) Suponha que u = kje, + ke; + +- + k,e,. Tomando o produto interno de u com e,, 


(me) = (kie; + kze, +55: + kpen, e1) 
= k (e1,e1) + io (e3,61) +e t kylen e1) 
= k (1) +% (0) + + k, (0) = k 
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Analogamente, para i = 2,3,...,n, 
(u, e;) = (kiei afete kie; qpassa AN e;) 
= tee) + kilen ei) + kalen e) 


=k (0) ++ k(D) + + A(O) = k; 
Substituindo (u, e;} no lugar de k, na equação u = kje, +-+- + k,e, obtemos o resultado. 


(b) Temos 


(Sae, x ba) =>), a;b;(e;,€;) = » a;b; (e;, e;) + X a;b;(e;,e;) 


ij=1 ifj 


Mas (e;,e;}) = 0, para i Æ j, e (e;,e;) = 1, para i = j. Logo, como queríamos, 
n n n 
Dae 2 bje; ) =} ab; = ab, + ab, +--+ aby 
i=l j=l i= 


(c) Pela parte (a), temos 


u= (u, e;)ei DAE (u, n) En e v= (v,e1)ei Spee (v, Crie 


Assim, pela parte (b), 


(u, v) = (u, e) (v, e1) i (u, ez) (v, ez) Gees (u, en) (V, en) 


Projeções, algoritmo de Gram-Schmidt, aplicações 
7.19 Suponha que w 0. Seja v um vetor qualquer de V. Mostre que 


o (v,w) o (v, w) 


o (ww) iwl? 


é o único escalar tal que v' = v — cw é ortogonal a w. 


Para ter v’ ortogonal a w, devemos ter 


(v— cw, w =0 ou (v,w)—c(w,w)=0 ou  (v,w) = c(w,w) 
BR ui MW) muda 
Assim, c . Reciprocamente, suponha que c = ———. Então 
(w, w) (w, w) 
(om, w) = (uw) = ofm w) = (00m) = ww =0 
w 


7.20 Encontre o coeficiente de Fourier c e a projeção de v = (1, —2, 3, —4) sobre w = (1, 2, 1, 2) em Ri. 


Calculamos (v, w) = 1—4 +3- 8= -8 e Iw|2=1+4+1+4= 10. Então 


8-4 Em d 
5 51 515 


e proj(v,w) = cw = (—5, 
7.21 Considere o subespaço U de Rº gerado pelos vetores 
v = (1,1,1,1), v = (1,1,2,4), vs = (1,2, —4, —3) 
Encontre (a) uma base ortogonal de U; (b) uma base ortonormal de U. 
(a) Usamos o algoritmo de Gram-Schmidt. Começamos denotando w; = u = (1, 1, 1, 1). Em seguida, calculamos 


(v2, w1) 8 
— -w = (1,1,2,4) —- (1,1,1,1) = (—1,—1,0,2 
v2 (w, wy (1, ry ) zb yky ) ( , 14 ) 


Denotamos w, = (—1, —1, 0, 2) e calculamos 


(v3, w1) (03, w2) 
(wi, w1) i (w2, w2) 


w, = (1,2, —4, —3) EE e E 


TD ÁLGEBRA LINEAR 


Limpamos as frações para obter w; = (1,3, —6, 2). Então w,, w,, w, formam uma base ortogonal de U. 


: 2 2 2 E 
(b) Normalizamos a base ortogonal formada por w,, w,, w;. Como ||w; ||" = 4, Iwz] = 6el|ws||É = 50, o conjunto 
de vetores seguintes forma uma base ortonormal de U. 


1 1 1 
=5(1,1,1,1), Na Us = 


7.22 Considere o espaço vetorial P(t) com o produto interno (f,g A t) dt. Aplique o algoritmo de 
Gram-Schmidt ao conjunto (1,t,t 2 para obter um conjunto a a A T com coeficientes inteiros. 


E 


Começamos denotando f} = 1. Em seguida, calculamos 


(6, 1) 2 1 
t l=t l=t 
(1,1) 1 2 
Limpamos as frações para obter fı = 2t — 1. Então calculamos 
2 2 1 1 
a D (é, 2t-1) 3 A 1 
t u-D=2-*(1)-S(0-D)=2-1+> 
ag” m- a-g PAS E 


Limpamos as frações para obter f) = 6 — 6t + 1. Assim, {1, 2t — 1, 6t — 6t + 1}é o conjunto ortogonal procurado. 


7.23 Seja v = (1, 3, 5, 7). Encontre a projeção de v sobre W ou, em outras palavras, encontre w € W que minimi- 
za ||v — w||, sendo W o subespaço de Rf gerado por 
(a) u = (1,1,1,1) e w=(1,-3,4,-2), 
(b) v = (1, 1, l, 1) e n= (1,2,3,2). 
(a) Como u, e u, são ortogonais, basta calcular os coeficientes de Fourier 
1+34+5+7 16 
G= (v, u) = = = 4 
(uj, u) 1+1+1+1 4 
(uu) 1—9+20-14 -2 1 
(uu) 1+9+16+4 30 15 


C 


Então w = proj(v, W) = ciu + com =4(1,1,1,1) = 35(1,-3,4,-2) = (B.F, 89). 
(b) Como u, e u, não são ortogonais, primeiro aplicamos o algoritmo de Gram-Schmidt para encontrar uma base 
ortogonal de W. Denotando w; = v; = (1,1,1,1), encontramos 
(v, wi) 8 
o tw w"! = (1,2,3,2) -3% 1, 1, 1) = (—1,0, 1,0) 


Denotando w, = (—1, 0, 1,0), calculamos 
_ (vw) 1+3 
1 


5+7 16 
1 


(wiwi) 1 


(um) —1+0+5+0 —6 3 


(ww) 1+0+1+0 2 


Então w = proj(v, W) = ciw; + cow, = 4(1,1,1, 1) — 3(—1,0, 1,0) = (7,4, 1,4). 


7.24 Sejam w, e w, vetores não nulos ortogonais e v um vetor qualquer de V. Encontre c, e c, tais que v' seja or- 
ka 
togonal a w, e w,, com V = V — CW] — CW. 
Se v’ é ortogonal a w,, então 
0 = (v= cw; = C&W, wi) = (v, w1) — ci (w1, W1) — Ca (w2, W1) 
= (v, w1) — c1 (w1, W1) — c20 = (v, w1) — ci (w1, wi) 
Assim, c} = (v, w1}/(w1, w1). (Ou seja, c, é o componente de v ao longo de w,.) Analogamente, se v é ortogonal a w,, 
então 
0 = (v= cW = cm, W2) = (V, W2) — calmo, W2) 


Assim, cy = (v, w3) / (w2, w2). (Ou seja, c, é o componente de v ao longo de w,.) 
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7.25 Demonstre o Teorema 7.8. Sejam w,, w,, ..., w, vetores ortogonais de V. Dado um vetor v qualquer de V, 


denotamos 
(v, Wi) 
vV=v—-(eow+om++cw,), com cc; ni 
Então v' é ortogonal a W,, W, ..., W,. 
Dado i = 1, 2, ..., r e usando que (wi, wj) = 0, com į Æ j, temos 
(v cm C2X7 a C, Wya Wi) = (v, wi) = cw Wi) 0 cÃW; Wi) ES a CW, Wi) 
= (v, wi) ty Oss a o, 2) 
(v, w;) 
= (v, w;) — G (w;, wi) = (v, w. wow) =0 
(uyw) — fome) = (0,00) = oi (wawi) 


Isso demonstra o teorema. 


7.26 Demonstre o Teorema 7.9. Seja (v,, v, ..., v,} uma base qualquer de um espaço com produto interno V. En- 
tão existe uma base ortonormal (u,, u, ..., u,) de V tal que a matriz de mudança de base de (v,) para (u,) é 
triangular, ou seja, para k = 1,2,...,n, 


Up = AV; + Gov, + ee + AU 


A demonstração utiliza o algoritmo de Gram-Schmidt e as observações 1 e 3 da Seção 7.7. Mais especificamente, apli- 


camos o algoritmo a (v,) para obter uma base ortogonal {w}, ..., w,), que normalizamos para obter uma base ortonormal 
{u;} de V. O algoritmo especificamente garante que cada w, é uma combinação linear de v,, ..., v, e, portanto, cada u, é 
uma combinação linear de v,, ..., v,. 


7.27 Demonstre o Teorema 7.10. Seja S = {w}, w», .... w,) uma base ortogonal de um subespaço W de um espa- 
ço vetorial V. Então S pode ser estendida a uma base ortogonal de V, ou seja, podemos encontrar vetores 


W,+1> +-+, W; tais que (w,, Wz, ..., W,) seja uma base ortogonal de V. 
Estendemos S a uma base S’ = (wi, sery MW Vac) Vp} de V. Aplicando o algoritmo de Gram-Schmidt a S”, primei- 
ro obtemos w,, ..., w,, porque S é ortogonal, e depois obtemos vetores W,.,1,...,Wytais que (w,, W3, ..., W, } é uma base 


ortogonal de V. Assim, provamos o teorema. 


7.28 Demonstre o Teorema 7.4. Seja W um subespaço de V. Então V = W W+. 


Pelo Teorema 7.9, existe uma base ortogonal (u,, ..., u,) de We, pelo Teorema 7.10, podemos estendê-la a uma base 
ortogonal (u,, t, .... u,) de V. Logo, u,,1,-- -Uun E WŁ. Dado v € V, temos 


L 
v=au+:--+tau,comau+-ctaueWea ut taummeW 


Assim, obtemos V = W + WŁ. 
Por outro lado, se w € W N W+, então (w, w) = 0, fornecendo w = 0. Logo, W N W+ = {0}. 
As duas condições V = W + W+ e W N W+ = {0} dão o resultado procurado V = W & W+. 


OBSERVAÇÃO Nossa demonstração foi feita no caso em que V tem dimensão finita. Observamos que o teorema 
também é válido em espaços de dimensão infinita. 


7.29 Seja W um subespaço de um espaço V de dimensão finita. Prove que W = W, 
Pelo Teorema 7.4, V = W ® W+ e, também y = W- & WL. Logo, 
dim W = dim V — dim W+ e dim W+ = dim V — dim W+ 
Isso fornece dim W = dim W+. Como W C W—- (ver Problema 7.14), resulta W = WH. 


7.30 Demonstre a afirmação dada. Seja w,, w», ..., w, um conjunto ortogonal de vetores não nulos de V. Seja v um 


vetor qualquer de V e c; o componente de v ao longo de w,. Dados escalares a,, ..., a, quaisquer, temos 
r Fr 
v— > comi < |v — > am 
k=1 k=1 
Ou seja, 5 C;W; é a melhor aproximação de v por combinações lineares de w,, ..., w, 


Pelo Teorema 7.8, v — 5" cw é ortogonal a cada w, e, portanto, ortogonal a qualquer combinação linear dos veto- 
Les W,, Wp, «.., W,. Portanto, usando o teorema de Pitágoras e somando de k = 1 a r, obtemos 


J Árcesra Linear 


2 2 2 2 
lv- Saw É = jo — > cewe + DO (cx — ar)will = [o — X comi HIZ Ce — aa 
2 
> Iv— >} cewyll 
A raiz quadrada de ambos lados nos dá o teorema. 


7.31 Seja {e}, e, ..., e,) um conjunto ortonormal de vetores de V. Seja v um vetor qualquer de V e c, o coeficiente 
de Fourier de v em relação a e, Demonstre a desigualdade de Bessel 


a > 2 
» & < lloll 
k=1 


Observe que c; = (v, e;)}, porque |/e,|| = 1. Então, usando (e;, e;) = 0, comi + j, e somando de k = 1 a r, obtemos 
0< (v-5E cren v- Pcre) = (v0) -2u Dee tEh = w) Elec 
= (vv) -P 2+ = (vE ck 


que dá a desigualdade de Besel. 


Matrizes ortogonais 
7.32 Encontre uma matriz ortogonal P cuja primeira linha seja u; = G , E , 3), 
Inicialmente, procuramos um vetor não nulo w, = (x, y, z) que seja ortogonal a u,, ou seja, para o qual 
0=(u,w)=>+>+>=0 ou x+2y+2z=0 
Uma tal solução é w, = (0, 1, —1). Normalizamos w, para obter a segunda linha de P, 
u, = (0, 1/2, —1/V2) 


Em seguida, procuramos um vetor não nulo w, = (x, y, zZ) que seja ortogonal a u, e, também, a u,, ou seja, para o qual 


x 2y 2 
0=(u,m)=5+5+5=0 ou x+2y+2z=0 
0 = (u, w3) zo O ou y-z2=0 


Tomando z = —1, encontramos a solução w, = (4, —1, —1). Normalizamos w, para obter a terceira linha de P, a saber, 


u, = (4/V18,-1/V18,-1/v'18). 


1 2 2 
Assim, P = i IA “1/5 
4/3N2 —1/3N2 —1/3/2 


Enfatizamos que a matriz P encontrada não é única. 


1 1 —1 
7.33 Seja4= |1 3 4 |. Decida se é válido, ou não. (a) As linhas de A são ortogonais; (b) A é uma matriz 
7 —S5 2 


ortogonal; (c) as colunas de A são ortogonais. 


(a) É válido, porque (1,1,-1)-(1,3,4)=1+3-4=0, (LI-1)-(7,-5,)=7-5-2=0€(1,3,4)- 
(7,—5,2)=7-15+8=0. 


(b) Não é, porque as linhas de A não são vetores unitários; por exemplo, ||(1, 1,- D|? = 1 +1 +1=3. 


(c) Não é; por exemplo, (1, 1,7) - (1,3, —5) = 1 +3 — 35 = —31 # 0. 


7.34 Seja B a matriz obtida normalizando cada linha da matriz A do Problema 7.33. 
(a) Encontre B. 


(b) Será B ortogonal? 


CaríruLo 7 * Espaços com PRODUTO INTERNO, ORTOGONALIDADE| —————— FD 


(c) Serão ortogonais as colunas de B? 
(a) Temos 
IML-DP=1+1+1=3, 1(1,3,9]/=14+9+16=26 
I(7,-5,DIP =49+25+4= 78 
1/03 1/03 -1/73 
Assim, B= | 1/26 3/v26 4/26 
7/NT8 —5/V78 2/VB8 


(b) E, porque as linhas de B continuam ortogonais e agora são vetores unitários. 


(c) São, porque as linhas de B formam um conjunto ortonormal de vetores. Então, pelo Teorema 7.11, as colunas de B 
formam, automaticamente, um conjunto ortonormal. 


7.35 Demonstre cada uma das afirmações seguintes. 
(a) P é ortogonal se, e só se, P” é ortogonal. 
(b) Se P é ortogonal, então P~! é ortogonal. 
(c) Se P e Q são ortogonais, então PQ é ortogonal. 
(a) Temos (PIT = P. Assim, P é ortogonal se, e só se, PPT = I se, e só se, PTP = I se, e só se, P” é ortogonal. 
(b) Temos PT = P-1 porque P é ortogonal. Assim, pela parte (a), P7! é ortogonal. 
(c) Temos PT =P! e Q7=Q!. Assim, (PQ)(PQ)” = PQQTPT = Pog!P! =I. Logo, (PQ) = (PQ)! e, 


portanto PQ é ortogonal. 


7.36 Seja P uma matriz ortogonal. Mostre que 
(a) (Pu, Pv) = (u, v), para quaisquer u, v € V; 
(b) ||Pul| = IJull, para cada u € V. 
T 


Usamos PP =I e (u,v) =u"v. 


(a) (Pu, Pv) = (Pu) (Pv) = uT PT Pv = utv = lu, v). 
(b) Temos 
|Pul? = (Pu, Pu) = u” P" Pu = uu = (u, u) = ul? 


Tomando a raiz quadrada de ambos lados, obtemos (b). 


7.37 Demonstre o Teorema 7.12. Sejam E = [e,) e E' = (e;) bases ortonormais de V e P a matriz de mudança 
de base da base E para a base E”. Então P é ortogonal. 


Suponha que 
e = bje; + bpe, + + binen, LS RO (1) 
Usando o Problema 7.18(b) e a hipótese da ortonormalidade de E”, obtemos 
dj = (ei, e;) = baba + bobo +: + Dib (2) 
Seja B = [b,] a matriz de coeficientes de (1). (Logo, P = BT.) Suponha que BB” = lc; Então 
Cj = baba + bab peti DinDm (3) 


Por (2) e (3), temos Cj = Oi. Assim, BB” = I. Decorre que B é ortogonal e, portanto, P = BT é ortogonal. 
7.38 Demonstre o Teorema 7.13. Sejam {e}, ..., e,) uma base ortonormal de um espaço com produto interno V e 
P = [a,] uma matriz ortogonal. Então os n vetores seguintes formam uma base ortonormal de V. 
G=metaneo++a,e i=1,2,...,n 
Como (e,) é ortonormal, o Problema 7.18(b) garante que 


(ese) = aja; + aviao; + e: + Anil; = (Ci, C;) 


E} ÁLGEBRA LINEAR 


onde C, denota a i-ésima coluna da matriz ortogonal P = [a,]. Como P é ortogonal, suas colunas formam um conjunto 


ortonormal. Isso implica (e;, et} = (C;, C;} = ô;j. Assim, {e;} é uma base ortonormal. 


Produtos internos e matrizes positivas 


7.39 


7.40 


7.41 


7.42 


Decida quais das matrizes simétricas dadas são positivas. 


o aG 0 s[e o cE Jo -E 3 
Usamos o Teorema 7.14, que afirma que uma matriz 2 x 2 real e simétrica é positiva se, e só se, suas entradas 
diagonais são positivas e seu determinante é positivo. 

(a) Não é, porque |A| = 15 — 16 = — 1 é negativo. 

(b) É positiva. 

(c) Não é, porque a entrada diagonal —3 é negativa. 


(d) É positiva. 


Encontre os valores de k com os quais as matrizes dadas são positivas. 


2 —4 4 k k 5 
(a) E |O) sal sO =|; o 


(a) Em primeiro lugar, k deve ser positivo. Também |A| = 2k — 16 deve ser positivo, portanto, 2k — 16 > 0. Assim, k> 8. 
(b) Precisamos que |B| = 36 — k? seja positivo, ou seja, 36 — k? > 0. Assim, k? < 36,0u-6<k<6. 


(c) C nunca será positiva, pois tem a entrada negativa —2 na diagonal. 


Encontre a matriz A que representa o produto interno canônico de R? em relação a cada uma das bases dadas 
de R? (a) {v = (1,3), v = (2,5)}; ©) {wi = (1,2), w, = (4, —2)}. 
(a) Calculamos (v1, v1) = 1 +9 = 10, (v, v2) = 2 + 15 = 17, (v, v2) = 4 + 25 = 29. Assim, 


10 17 
a A 


5 0 
(b) Calculamos (w1, w1) = 1 +4 = 5, (ww) =4-— 4 = 0, (w2, w2) = 16 +4 = 20. Assim, 4 = É | 


(Como os vetores da base são ortogonais, a matriz A é diagonal.) 


Considere o espaço vetorial V = P,(t) com produto interno (f,g) = e felt) dt. 
(a) Encontre / f, g), com f(t) = t+ 2e g(t) =Ê —3t +4. 
(b) Encontre a matriz A do produto interno em relação à base {1, t, P) de V. 


(c) Verifique o Teorema 7.16, mostrando que ( f, g} = [f]/ Alg] em relação à base {1, t, £}. 
al el 4 3 1 

(a) (f,g) | (t+2)\(Ê —3t+4) a = | (Ê — P — 2t + 8) dt = É i 2 +81) 
= —1 


4 3 


si 
(b) Aqui usamos o fato de que, se r + s = n, então 


prt 1 


1 
n=] "dt = 
-1 


o ra se n é par, 


n+1/4 0 se n é ímpar. 


Então (1, 1) = 2, (1,2) = 0, (1,82) = Z, (t, t) = Z, (t, E) = 0, W) = É Assim, 


2 
A=|0 
2 
3 


Ouin O 
UI OD Io 


7.43 


7.44 


7.45 
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(©) Temos[f]” = (2,1,0) e [g]” = (4, -3,1) em relação à base dada. Então 


20 2[4 4 
2 02] 1 1 


a P iga ” e pa Vs sa 
Demonstre o Teorema 7.14. 4 = b é positiva se, e só se, a e d são positivos e|A| = ad — b“ é positivo. 


Seja u = [x,)]”. Então 
=al iy dd 2 2 
F(u)=u Au= bois d [| -a + 2bxy + dy 


Suponha que fu) > 0, para cada u Æ 0. Então, f1, 0) = a > 0 e f0, 1) = d > 0. Também, f(b, —a) = a(ad — b?) > 0. 
Como a > 0, obtemos ad — b? > 0. 

Reciprocamente, suponha que a > 0, d > 0, ad — b'>0. Completando o quadrado, obtemos 
by ad-b 
2) E y 
a a 


2b b? b? 
sa =a(2+ Drs) ta? Ep mafra 
a a a 
Dessa forma, fu) > 0, para cada u Æ 0. 


Demonstre o Teorema 7.15. Seja A uma matriz real positiva. Então a função (u, v) = u Av é um produto 
interno de R”. 


Dados vetores u,, U, € v, 
(u, +u, )=(u+u)Av=(u+ul)Av=ulAvAulAv= (u, v) + (n, v) 
e, dado qualquer escalar r e vetores u, v, 
(ru, v) = (ru) Av = ru Av = r lu, v) 


Logo, vale [I]. 
Como „T 4y é um escalar, (uT A v)” = u Av. Também, A” = A, pois A é simétrica. Logo, 


(u, v) = uT Av = (uT Av)" = v ATu = vAu = (v, u) 
Logo, vale [L]. 
Finalmente, como A é positiva, temos X TAX >0, para cada X € R” não nulo. Assim, dado qualquer vetor não nulo 


v, temos v, (v, v} = v7 Av > 0. Também, (0,0) = 0740 = 0. Assim, vale [L]. Em vista disso, a função (u, v) = Av é 
um produto interno. 


Demonstre o Teorema 7.16. Seja A a representação matricial de um produto interno em relação a uma base 
S de V. Então, dados quaisquer vetores u, v € V, temos 


(u, v) = [u]"A[e] 


Suponha que § = {w,, w», ..., w,} e que A = [k,). Então, kj = (w;, wo). Suponha que 


u=awtaw++Ha,w, e v = biw; + bw +-+ + bp, Wn 
Então (u, v) = » > a;b;(wi, w;) (1) 
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Por outro lado, 


ki kn . kin bi 
bi kha dk b, 
fujPA(o] = (aana) [À a 
ka kn Kan b, 
bi 
n n n bz n n 
= > aka, Dik, ++.» Daka) J= > a;b;ky (2) 
i=l i=1 i=l : j=l i=l 
b 


As equações (1) e (2) garantem a afirmação do teorema. 
7.46 Demonstre o Teorema 7.17. Seja A a representação matricial de algum produto interno de V. Então A é uma 


matriz positiva. 


Como (W;, w) = (w;, Wi) vale para quaisquer vetores w, e w, da base, a matriz A é simétrica. Seja X um vetor não nulo 


qualquer de R”. Então [u] = X, para algum vetor u € V não nulo. O Teorema 7.16 afirma que XTAX = [u]"Afu] = 
(u,u) > 0. Assim, A é positiva. 


Espaços com produto interno complexos 


7.47 Seja V um espaço com produto interno complexo. Verifique a relação 
(u, av + bv) = a(u, vı} + blu, v) 


Usando [7%], [/*] e, depois, [1%], obtemos 


(u,av + bu) = (av, + bv, u) = a(v,u) + b(w,,u) = a(v,u) + bhi, u) = alu, vi) + blu, v) 


7.48 Suponha que (u, v) = 3 + 2i num espaço com produto interno complexo. Encontre 


(a) ((2 — 4i)u, v); (b) (u, (44300); (o) ((3-—-6)u, (5 — 2i)v). 


(a) ((2 — 4i)u, v) = (2 — 4i) (u, v) = (2 — 4i) (3 + 2i) = 14 — 8i 
(b) (u, (4+ 3i)v) = (4 + 3i) (u, v) = (4 — 3i)(3 + 2i) = 18 — i 
(c) (3 — 6i)u, (5 — 2i)v} = (3 — 6i) (5 — 2i) (u, v) = (3 — 6i)(5 + 2)(3 + 2i) = 129 — 18i 


7.49 Encontre o coeficiente de Fourier (componente) c e a projeção cw de v = (3 + 4i, 2 -— 3i) sobre 
=(5+i, 2)emC? 
Lembrando que c = (v, w} / (w, w), calculamos 
(v, w) = (3 +4) (5 F i) + (2 — 3i) (2i) = (3 + 4i)(5 — i) + (2 — 3i)(—2i) 
= 19 + 17i — 6 — 4i = 13 + 13i 
(w,w) =25+1+4=30 


u 
Ne) 
(se 
ms 
~ 
— 


Assim, c = (13 + 13:)/30 = & + Bi. Decorre que proj(v, w) = cw = (É 
7.50 Demonstre o Teorema 7.18 (Cauchy-Schwarz). Seja V um espaço com produto interno complexo. Então 
|u, 0) < [lullo 


Se v = 0, a desigualdade reduz a 0 < 0 e, portanto, é válida. Agora, Súponpa que v Æ 0. Usando zZ = Iz}? (válido 


para números complexos) e (v, u) = (u, v), expandimos ||u — (u, v)tvl|? > 0, em que t é um valor real. 
0 < |u — (u, tuP= (u — (u, voto, u— lu, vytv) 
= (u,u) — (u, vt(u,v) — (u, vjtlv, u) + (u, vu, VÊ(o, v) 
= |jul? — 2t| (u, v)? + (u, o?e ol? 
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2 
Hu, v)| 
—. 
Io 


quadrada de ambos lados, obtemos a desigualdade procurada. 


Tomamos ź = 1/lloll? para obter 0 < jul? — do que decorre |u, v)? < loll loll. Tomando a raiz 


7.51 Encontre uma base ortogonal de u+ em C?, comu = (1, i, 1 +i). 


L 


Aqui u~ consiste em todos os vetores s = (x, y, Z) tais que 


(w,u) =x — iy + (1— i)z =0 
Encontramos uma solução, digamos, w; = (0, 1 — i, i). Então resolvemos o sistema 
x — iy + (1 — i)z = 0, (1+D)y-iz=0 


Aqui, z é uma variável livre. Tomamos z = 1 para obter y = i/(1 +i) = (1 + i)/2 e x = (3i — 3)2. Multiplicando 
por 2, obtemos a solução w, = (3i— 3, 1+i, 2). Os vetores w, e w, formam uma base ortogonal de ut. 


7.52 Encontre uma base ortonormal do subespaço W de Cc gerado por 
vı = (1,i,0) e w=(1,2, 1-i). 
Aplicamos o algoritmo de Gram-Schmidt. Tomamos w; = v; = (1,i,0)e calculamos 
(v, wi) a 1-2 


v — -——— w = (1, 2, 1—i 
E a 


(L,i,0)=(L+i, 1-4i, 1-i) 


Multiplicamos por 2 para limpar as frações, obtendo w, = (1 +2i, 2— i, 2 — 2i). Em seguida, calculamos 
wil] = v2 e||w>|| = v18. Normalizando (w,. w,), obtemos a base ortonormal de W seguinte. 


[a(o 0 Juego vm vas) 


7.53 Encontre a matriz P que representa o produto interno canônico de C'em relação à base (1, i, 1-— i}. 


Calculamos os seis produtos internos a seguir. 


(1,1)=1, (0,ùġ =i = i, 0,1-ġ=I-i 
)=i=1, l-)=i1-D)=-1+i, (=; 1=-ġ=2 


Em seguida, usando (u, v) = (v, u), obtemos 


(Conforme esperado, P é hermitiana, ou seja, P” = Pj 


Espaços vetoriais normados 


7.54 Considere os vetores u = (1,3, —6,4) e v=(3,-5,1,-2) de R4. Encontre 
(a) lulo e ole © luli e lol (O lula e lola, 
(d) d (u, v), di (u, v), da (u, v). 
(a) A norma infinito escolhe o máximo do valor absoluto dos componentes. Logo, 
lulls 56 œ lello =5 
(b) A norma 1 soma o valor absoluto dos componentes. Logo, 
luli =1+3+6+4= 14 e lali =3+5+1+2=11 


(c) A norma 2 é igual à raiz quadrada da soma do quadrado dos componentes (ou seja, a norma induzida pelo produto 
interno canônico de R3). Logo, 


llulla = V1 +9 +36 + 16 = v62 e loll = VI +25 +1 +4 = 39 


(d) Primeiro calculamos u — v = (—2, 8, —7, 6). Então 


JJ  Árcesra Linear 


doo( 
d(u,v)=I|u-—vl,=2+8+7+6=23 


d (u, v) = ||u — vll, = V4 + 64 + 49 +36 = 153 


10) = llu — vllo = 8 


e 


7.55 Considere a função f (t) = t? — 4t de C[0, 3]. 
(a) Encontre || f ||. (b) Esboce o gráfico de f(t) no plano R°, (c) Encontre || ||, (d) Encontre || f ||. 


(a) Queremos calcular || f || = max(| f (t)|). Como f(t) é derivável em [0, 3], |f(1)| atinge um máximo num ponto 
crítico de f(t) (ou seja, quando a derivada f'(t) = 0), ou num extremidade de [0, 3]. Como f'(t) = 2t — 4, 
tomamos 2t — 4 = 0 e obtemos t = 2 como ponto crítico. Calculando, 


f(2)=4-8 = —4, f(0)=0-0=0, f3)=9-12=-3 


Assim, || fllo = |(2)| = |— 4] =4. 
(b) Calculamos f(t) para alguns valores de t em [0, 3], por exemplo, 
t | 0 1 2 3 
TAE EE 


Esboçamos os pontos de R?e traçamos uma curva contínua pelos pontos, conforme Figura 7-8. 
(c) Queremos calcular || f ||; = i | f(t)| dt. Conforme indicado na Figura 7-8, f(t) é negativa em [0, 3], portanto, 
IJOL = -P 4t) = 4t -ť. 
3 B 
assim fl = | (4-2) a= (22-5) 
Jo 


3 
=18-9=9 


0 


3 3 5 3 |3 
t 16t 153 
(d) 1718 =] TAG a= (É — 8P + 16°) dt = 2f + =—. 
A E 5 Ed 5 
; 153 
Assim, || f|l, = z 
Ho 
l 
, o; 
-1 0 1 2 3 4 
=] 
NI 
-3 
-4 + 
ad 
Figura 7-8 


7.56 Demonstre o Teorema 7.24. Seja V um espaço vetorial normado. Então a função d(u, v) = ||u — vl| satisfaz 
os três axiomas de espaço métrico, como segue. 


[M] d(u, v) > 0e d(u, v) = 0 se, e só se, u = v. 
M] d(u, v) = d(v, u). 
[M;] d(u, v) < d(u,w) + d(w, v). 


Se u Æ v, então u — v £ 0 e, portanto, d (u, v) = ||u — v|| > 0. Também d (u, u) = ||u — ul] = ||0|| = 0. Assim, 
[M] é válido. Também temos 
d(u, v) = |lu — vll = || = 1(0 = 29] =| = 1llv = ull = |v — ul) = d(v, u) 
e d(u, v) = ||u — vl| = ||(u > w) + w — o) < Ilu — wl] + |w — v]l = d(u, w) + d(w, v) 


Assim, [M,] e [M,] são válidos. 
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Problemas Complementares 


Produtos internos 


7.57 Verifique que define um produto interno de R?, comu = (x,,x)) e v= (y1, y2), a função 


f(u, v) = xyi — 2x1 y2 — 2x2 y1 + 5X, y2 


7.58 Encontre os valores de k que fazem um produto interno de R?, comu = (x,,x5)) e v= (y1, y2), da função 


f(u, v) = xyi — 3x1 y2 — 3x2 y1 + hoo y2 
7.59 Considere os vetores u = (1,—3) e v= (2,5) de R?. Encontre 


(a) (u, v) em relação ao produto interno canônico de R°. 
(b) (u, v) em relação ao produto interno de R? do Problema 7.57. 
(c) Iv] usando o produto interno canônico de R°. 


(d) Ju] usando o produto interno de R? do Problema 7.57. 
7.60 Mostre que cada uma das funções seguintes não é um produto interno de Rê, comu = (x,,X2,X3) e v= (y1, y2, y3). 
(a) (u,v) =xy; +xX2y2, (b) (u,v) = X1y2X3 + Y1X2V3. 


7.61 Seja V o espaço vetorial das matrizes m x n sobre R. Mostre que (4, B) = tr(B7 A) define um produto interno de V. 


7.62 Suponha que |(u, v)| = ||ul||||v||. (Observe que isso é a “igualdade” de Cauchy-Schwarz.) Mostre que u e v são linear- 
mente dependentes. 


7.63 Sejam f(u, v) e g(u, v) produtos internos de um espaço vetorial V sobre R. Prove. 


(a) A soma f + g é um produto interno de V, sendo (f + g)(u, v) = f(u, v) + g(u, v). 
(b) O múltiplo kf, com k > 0, é um produto interno de V, sendo (kf(u, v) = kf(u, v). 


Ortogonalidade, complementos ortogonais, conjuntos ortogonais 


1 
7.64 Seja Vo espaço vetorial dos polinômios sobre R de grau < 2 com o produto interno definido por ( f, g) = Jo f(Dg(t) dt. 
Encontre uma base do subespaço W ortogonal a A(t) = 2t + 1. 
7.65 Encontre uma base do subespaço W de Rº ortogonal au, = (1, —2,3, 4) e u = (3, —5,7, 8). 


7.66 Encontre uma base do subespaço W de Rº ortogonal aos vetores u; = (1,1,3,4, 1) e m=(1,2,1,2,1). 


7.67 Sejaw = (1, —2, —1,3)um vetor de Rº. Encontre 


(a) uma base ortogonal de wt, (b) uma base ortonormal de w+. 


7.68 Seja W o subespaço de Rf ortogonal au, = (1,1,2,2) e u, = (0,1,2,-1). Encontre 
(a) uma base ortogonal de W, (b) uma base ortonormal de W. (Compare com o Problema 7.65.) 


7.69 Seja S o conjunto constituído dos vetores de Rº dados. 


uy = (1,1,1,1), u, = (1,1,—1,—1), us = (1,—1,1,—1), u4 = (1,—1,—1,1) 
(a) Mostre que S é ortogonal e uma base de Rº. 
(b) Escreva v = (1,3, —5,6) como uma combinação linear de u,, u,, Us, U4. 
(c) Encontre as coordenadas de um vetor v = (a, b,c, d) arbitrário de Rºem relação à base S. 


(d) Normalize S para obter um conjunto ortonormal de Rf. 
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7.70 Considere M = M, , com o produto interno (A, B) = tr(B7 4). Mostre que é uma base ortonormal de M o conjunto 


to ob lo o) Lt o) o l) 


7.71 Considere M = M, » com o produto interno (4, B) = tr(B7 4). Encontre uma base para o complemento ortogonal (a) 
das matrizes diagonais, (b) das matrizes simétricas. 


7.72 Seja (u,, u,, ..., u,) um conjunto ortogonal de vetores. Mostre que, dados escalares a,, a,, ..., a, quaisquer, o conjunto 
tau, au, ...,au,) é ortogonal. 


7.73 Sejam U e W subespaços de um espaço com produto interno V de dimensão finita. Mostre que 


(3) (U+W) =UlnW+, 6) (UNnWY =U} ++. 


Projeções, algoritmo de Gram-Schmidt, aplicações 
7.74 Encontre o coeficiente de Fourier c e a projeção cw de v sobre w, com 


(a) v=(2,3,-5) e w= (1,—5,2)em R°. 
b) v= (1,3,1,2) e w=(1,-2,7,4)emR'º. 


(0) v=Ê e w= t+3em P(t, com produto interno (f,2) = ff 


| e w= E s [em M = M,,», com produto interno E / = tr(B"4A). 


7.75 Seja U o subespaço de Rº gerado por 
v = (1,1,1,1), v = (1,—1,2,2), vz = (1,2, —3, —4) 
(a) Aplique o algoritmo de Gram-Schmidt para encontrar uma base ortogonal e uma base ortonormal de U. 


(b) Encontre a projeção de v = (1,2, —3, 4) sobre U. 


7.76 Sejav = (1, 2, 3, 4, 6). Encontre a projeção de v sobre W ou, em outras palavras, encontre w € W que minimiza ||v — w|], 
sendo W o subespaço de Rº gerado por 


@) m=(1,2121) e u = (1,—1,2,—1,1) 6) w=(1,2,1,21) e w=(1,0,1,5,-1). 


7.77 Considere o subespaço W = P,(t) de P(t) com o produto interno (f,g = [fl t) dt. Encontre a projeção de 
f(t) = É sobre W. (Sugestão: use os polinômios ortogonais 1,24 — 1, o — 6t+1 a> no Problema 7.22.) 


7.78 Considere P(t) com o produto interno (1,8) = fi Fltglt)eo subespaço W = P.(1). 


(a) Encontre uma base ortogonal de W aplicando o algoritmo de Gram-Schmidt em (1, t, a P}. 


(b) Encontre a projeção de f(t) = É sobre W. 


Matrizes ortogonais 
l 
7.79 Encontre o número de todas as matrizes 2 x 2 ortogonais da forma | E j e exiba-as. 


7.80 Encontre uma matriz3 x 3 ortogonal P cujas duas primeiras linhas sejam múltiplos deu = (1,1,1) e v=(1,-2,3), 
respectivamente. 


7.81 Encontre uma matriz ortogonal simétrica P cuja primeira linha seja ( , E ; 3). (Compare com o Problema 7.32.) 


7.82 Dizemos que duas matrizes reais A e B são ortogonalmente equivalentes se existir uma matriz ortogonal P tal que 
B = PT AP. Mostre que essa relação é de equivalência. 
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Produtos internos e matrizes positivas 


7.83 


7.84 


7.85 


7.86 


7.87 


7.88 


7.89 


Encontre a matriz A que representa o produto interno canônico de R? em relação a cada uma das bases seguintes. 


(a) tu = (1,4), v= (2, = (b) tw = (1; =3); W= (6,2)}. 


Considere o produto interno de R? dado por 


f(u, v) = xyi — 2x1), — 2,7 + 5x22, com u = (x1, x2) v= (y1, y2) 


Encontre a matriz B que representa esse produto interno de R? em relação a cada base do Problema 7.83. 


Encontre a matriz C que representa o produto interno canônico de R? em relação à base S formada pelos vetores 


u = (1,1,1), u = (1,2, 1), u = (1, —1,3). 


Seja V = P,(t) com produto interno (f, 2) = POO) dt. 
(a) Encontre(f,g), com f(t)=t+2 e g(t) =P -—3t+4. 
(b) Encontre a matriz A do produto interno em relação à base {1, t, r} of V. 


(c) Verifique o Teorema 7.16, mostrando que ( f, g) = [f] TA [g] em relação à base {1, t, °}. 
Decida quais das matrizes seguintes são positivas. 
1 3 3 4 4 2 6 =7 
(a) É I ©) Ê I (0) b | (d) E a) 
Sejam A e B matrizes positivas. Mostre que 
(a) A + B é positiva, (b) kA é positiva, com k > 0. 


Seja B uma matriz real não singular. Mostre que (a) BTB é simétrica, (b) B7B é positiva. 


Espaços com produto interno complexos 


7.90 


7.91 


7.92 


7.93 


7.94 


7.95 


7.96 


Verifique que 
(au tau bivi + bv) = a,b; (u, v1) + abolu, v2) + azb, (u, v1) + azb (uz, v2) 
Mais geralmente, prove que (3.7, aju;, a bju) = Di; abu; vi). 


Considere u = (1 +i, 3, 4-i) e v=(3-4i, 1 +i, 2i)de C°. Encontre 
(a) (u,v), (0) (v,u), © llull, (® |joll, (e) d(u, v). 

Encontre o coeficiente de Fourier c e a projeção cw de 

(a) u= (3 +i, 5-2i)sobrew = (5 +i, 1+ i)em ©. 

6) u=(1—i, 3i, 1 +i)sobrew= (1, 2-i, 3+ 2i)em ©. 


Sejam u = (2,,2)) e v= (w1, w3) de C2 Verifique que a função dada é um produto interno de C’. 


Flu, v) = ZW] | (1 | zm, | (1 )z5W| | 3z, W3 
Encontre uma base ortogonal e uma base ortonormal do subespaço W de C? gerado poru; = (1, i, l)eu = (1 +i, 0, 2). 


Sejam u = (Zz1,Z2) e v= (w1, wz)de C?. Encontre os valores de a,b,c,d € C para os quais a função dada é um 
produto interno de C^. 


f(u, v) = azw, + bzw, + czom, + dam, 


Demonstre a expansão seguinte de um produto interno de um espaço complexo V. 


2 2 -J2 PER 
(u, v) = 4 lu + vl? = z llu = JE + zlu + iol = 3 llu — iv] 
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[Compare com o Problema 7.7(b).] 


7.97 Seja V um espaço com produto interno real. Mostre que 
(a) Ijull = |vlse e só se, (u + v, u—v) = 0. 
(b) lju + vl? = llul? + Ilol]? se, e só se, (u, v) = 0. 


Dê contraexemplos que mostrem que as afirmações dadas não valem em, digamos, E 
7.98 Encontre a matriz P que representa o produto interno canônico de C? em relação à base {1, 1 +i, 1-— 2i}. 
7.99 Uma matriz complexa A é unitária se for invertível e A`! = A". Alternativamente, A é unitária se suas linhas (colunas) 


formarem um conjunto ortonormal de vetores (em relação ao produto interno canônico de C”). Encontre uma matriz 
Sib : e é Ea ; e 1 l; 1 1 
unitária cuja primeira linha seja (a) um múltiplo de (1, 1 —i), (b) um múltiplo de G » 2h 272 i). 


Espaços vetoriais normados 


7.100 Considere os vetores u = (1,-3,4,1,-2) e v= (3,1, —2, —3, 1) de R$. Encontre 
(a) lulo e lel ©) llul e leli © llul e Iel (d) do (u, v), dı (u, v), do(u,v) 


7.101 Repita o Problema 7.100 com u = (1 +i, 2—4i) e v=(l1—i, 2+ 3i)de C. 


7.102 Considere as funções f(t) = 5t— £ e g(t) = 3t — č de CIO, 4]. Encontre 
(a) dol f2) (b) di(f,8), (c) d(f,8) 


7.103 Demonstre que (a) || - ||, é uma norma de R”, (b) || + ||, é uma norma de R”. 


7.104 Demonstre que (a) || - ||, é uma norma de Cla, b], (b) || - ||, é uma norma de Cla, b]. 


Respostas dos Problemas Complementares 


Notação: M = [R,; R,; ...] denota uma matriz M de linhas R,, R,, ... Também observe que as bases não são únicas. 
7.58 k>9 
7.59 (a) -13, (b) 7, (o) v29, (dq v89 
7.60 Seja u = (0,0, 1); então (u, u) = 0 em ambos casos. 
7.64 (72 — 5t, 122 — 5} 
7.65 ((1,2,1,0), (4,4,0,1)) 


7.66 (-1,0,0,0, 1), (—6,2,0, 1,0), (—5,2, 1,0,0) 


7.67 (a) u = (0,0,3, 1), uz = (0,5, 1,3), u = ( 14, 2, 1,3), 
(b) u,/vV10, uz /v35, u3 /v210 


7.68 (a) (0,2,-1,0),(-15,1,2,5), (b) (0,2,-1,0)//5, (—15,1,2,5)/v'255 


7.69 (b) v=i(Sm +3u, — 13u; + 9u4), 
(co) [vu=ila+b+c+d, a+b-c-d, a-b+c-d, a—b-c+d] 


7.71 (a) 0,1; 0,0], 10,0; 1,0, (o) [0,-1; 1,0) 


774 (0) c=- ©) c=} © c=% (dO) c=% 
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7.75 (a) Wi = (1, l; 1, 1), w2 = (0, —2, l; 1), w3 E (12, =A; =L=7), 
(b) proj(v, U) =5(-1,12,3,6) 


7.76 (a) proj(v, W) = į (23,25,30, 25,23), (b) Primeiro, encontre uma base ortogonal de W, digamos, w; = (1,2, 1,2,1) e 
w, = (0,2,0, —3, 2). Então, proj(v, W) = 1 (34, 76,34, 56,42). 


7.77 proj(L,W)=52 -t+ 
7.78 (a) {1, t, 3—1, 5P — 3t}, (b) proj(f,W)= LP -àt 


7.79 Quatro:[a,b; b,-a), [a,b; —b,-a), [a,—b; b,a], la,—b; —b,—a], where a=} e b=1v8 


7.80 P=[1/a,1/a,1/a; 1/b,—2/b,3/b; 5/e,-2/c,-3/c), coma = v3,b = v14,c = v38 
7.81 }[1,2,2; 2,-2,1; 2,1,-2] 

7.83 (a) [17,-10; —10,13], (œ) [10,0; 0,40] 

7.84 (a) [65,-68; —68,73], (b) [58,8; 8,8] 


7.85 3,4,3; 4,6,2; 3,2,11] 


7.86 (a) B (b) [l,a,b; a,b,c; b,c,d], coma =4, b =4, c=} d=} 
7.87 (a)Nãoé, (b)É, (c)Nãoé, (d)É. 

7.91 (2) —4i, (b) 4, (0) v28, (d) v3, (o) v59 

7.92 (a) c= (19 — 5i), (b) c=ġ4(3 + 6i) 

7.94 {u = (L41) W3, v = (2i, 1-3, 3-1)/V24) 

7.95 aed reais e positivos, c = b e ad — bc positivos. 


7.97 u= (1,2), v= (1,21) 


798 P=[l, 1-i, 1+2; 1+i 2, -1+3; 1-2, 13%, 5] 


7.99 (a) (1/N3)ll, 1- 1+i -1], 
(b) la, ai, a—ai; bi, b, 0; a, ai, -a-ai,coma=1 e b=1/v2. 


7.100 (a3)4e3,(b) 11 e 10,(c)V31 e v24, (d) 6, 19,9 


7.101 (a) v20 e v13, (b) v2+v20 e v24+V13, (© v22 e v15, (d) 7,9,/53 


7102 ()8, (b) 16, (c)16/v3. 


Capítulo 8 


Determinantes 


8.1 INTRODUÇÃO 


A cada matriz quadrada A = [a] de ordem n está associado um escalar especial, denominado determinante de A e 
denotado por det(A), ou |A| ou 


dd Ain 
a2) do An 
an1 an2 Am 


Enfatizamos que uma tabela n x n de escalares emoldurada por segmentos de reta, denominada determinante de 
ordem n, não é uma matriz e somente denota o determinante da tabela de escalares (ou seja, da matriz emoldurada). 

A função determinante foi descoberta durante a investigação de sistemas de equações lineares. Veremos que o 
determinante é uma ferramenta indispensável na investigação e na obtenção de propriedades de matrizes quadradas. 

A definição do determinante e a maioria de suas propriedades também se aplicam ao caso em que as entradas 
da matriz provêm de um anel comutativo. 

Começamos com o caso especial de determinantes de ordens 1, 2 e 3. Depois definimos um determinante de 
ordem arbitrária. Essa definição geral é precedida por uma discussão de permutações necessária para a nossa defi- 
nição geral de determinante. 


8.2 DETERMINANTES DE ORDENS 1 E 2 


Os determinantes de ordens 1 e 2 são definidos como segue. 


la| =a e “i 2| ajan — apa 
11] = E = diia 12421 
a an 
Assim, o determinante de uma matriz A = [a,,] de ordem 1 é o próprio escalar a,,, isto é, det(A) = |a,| = a,,. O 
determinante de ordem dois pode ser facilmente lembrado usando o diagrama a seguir. 
+ = 
Ê 
a 


Ou seja, o determinante é igual ao produto dos elementos ao longo da seta marcada com o sinal de soma menos o 
produto dos elementos ao longo da seta marcada com o sinal de diferença. (Existe um diagrama análogo para de- 
terminantes de ordem 3, mas não para determinantes de ordens superiores.) 
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Exemplo 8.1 
(a) Como o determinante de ordem 1 é o próprio escalar, temos 
det(27) = 27, det(—7) = —7, det(t-3)=t—3 
53 3 2 
b = = - = — 
oli 4 5(6) — 3(4) = 30 — 12 = 18, E é 21+10=31 


Aplicação a equações lineares 

Considere duas equações lineares com duas incógnitas, digamos, 
az+by=c 
ax + bay = c3 


Seja D = a,b, — a,b, o determinante da matriz de coeficientes. Então o sistema tem uma única solução se, e só se, 
D + 0. Nesse caso, a única solução pode ser completamente expressa em termos de determinantes, como segue. 


c b | q q | 
SoNg bxc; — bic; do bz y= N, = MC) — aC | C2 
= = = : = — = 
D aib, = abı a bi D ab» = abı a bı 
a b, a, b, 


Observe que D aparece no denominador de ambos os quocientes. Os numeradores N, e N, dos quocientes que de- 
terminam x e y, respectivamente, podem ser obtidos substituindo a coluna dos termos constantes no lugar da coluna 
dos coeficientes da incógnita dada na matriz de coeficientes. Por outro lado, se D = 0, então o sistema pode não ter 
solução ou, então, ter mais de uma solução. 


4x — 3y = 15 


Exemplo 8.2 Resolva com determinantes o sistema 
2x+5y= 1 


Primeiro, calculamos o determinante D da matriz de coeficientes. 


D= 


f 5 =45)- (-3)2) =20+6=26 


2 > 


Como D 0, o sistema possui solução única. Para obter os numeradores N, e N,, simplesmente substituímos, na 
matriz de coeficientes, os coeficientes de x e y, respectivamente, pelos termos constantes e, então, tomamos seus 
determinantes. 


E —3 


4 15 
| 5|=75+3=78 pal 


E || =4-30= -26 


Então, a única solução do sistema é 


78 N, -26 
=—=3 = — = — = -l 
D 238 ” =D 2% 


8.3 DETERMINANTES DE ORDEM 3 


Considere uma matriz qualquer A = [a,] de ordem 3. O determinante de A é definido como segue. 
A do dis 
det(4) = |a an an |= 105233 + 4124723431 + 413421432 — 413422431 — 412421433 — 411423432 
a31 432 433 


Observe que há seis produtos, cada um consistindo de três elementos da matriz original. Três desses produtos rece- 
bem o sinal positivo (mantêm seu sinal) e os outros três recebem o sinal negativo (mudam seu sinal). 
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Os diagramas da Figura 8-1 podem ajudar a lembrar desses seis produtos de det(A). Ou seja, o determinante é 
igual à soma dos produtos dos elementos ao longo das três setas assinaladas com o sinal de soma na Figura 8-1, mais 
a soma dos negativos dos produtos dos elementos que estão nas setas assinaladas com o sinal de diferença. Enfatiza- 
mos que não existem recursos visuais com os quais seja possível lembrar determinantes de ordens superiores. 


Figura 8-1 


2 1 1 3 2 1 
Exemplo 8.3 Sejam 4 = fo 5 a] ecB= E 5 + | . Encontre det(A) e det(B). 
1 —3 4 2 —3 4 


Usamos os diagramas da Figura 8-1. 
det(4) = 2(5)(4) + 1(=2)(1) + 1(=3)(0) = 1(5)0) — (=3)(=2)(2) — 4(1)(0) 
=40-2+0-5-12-0=21 
det(B) = 60 — 4 + 12 — 10 — 9 + 32 = 81 


Forma alternativa para o determinante de ordem 3 


O determinante de uma matriz A = [a,] de ordem 3 pode ser reescrito como segue. 
det(4) = an (32423 — 423432) — apo (do 1a33 — 423431) + ais (421432 — 422431) 


an 423 a2) 423 a2) do 
= a = 41 + a13 


a32 433 a31 433 a31 32 


que é uma combinação linear de três determinantes de ordem 2 cujos coeficientes (com sinais alternados) formam 
a primeira linha da matriz dada. Essa combinação linear pode ser indicada como segue. 


ai dp aj a&i) Go dis 4 do di3 
Qj|doj do A3 |— Gj|do An do |+ 43| do do 
a3) A32 33 a3) 32 das a3) dy) 33 


Observe que cada matriz 2 x 2 pode ser obtida suprimindo, na matriz original, a linha e a coluna que contêm seu 


coeficiente. 
Exemplo 8.4 
L 2/3 Io 23 os S 
4 -2 3|=14 -2 3|-2|4 2 3|+3|4 -2 3 
0 5 — 0O 5 -i o BB -1 o 5 E 
-2 3 4 3 4 -2 
=] —2 +3 
5 — 0 — 0 5 
= 1(2 — 15) — 2(—4 + 0) + 3(20 + 0) = —13 + 8 + 60 = 55 
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8.4 PERMUTAÇÕES 


Uma permutação o do conjunto (1,2, ..., n} é uma bijeção desse conjunto em si mesmo ou, equivalentemente, uma 
reordenação dos números 1, 2, ..., n. Uma permutação o é denotada por 


nel, E r) EEE T mE 
di dia eme dh da i 


O conjunto de todas essas permutações é denotado por S, e o número dessas permutações é n!. Seo € S,, então a 
aplicação inversa o | € S, e, se c, T € S, então a aplicação composta o o T € S,. Também a transformação iden- 
tidade £ = 0001 € S, (Na verdade, € = 123...n.) 


Exemplo 8.5 


(a) Existem 2! = 2 - 1 = 2 permutações em S,, a saber, 12 e 21. 
(b) Existem 3! =3.2.1 = 6 permutações em S}, a saber, 123, 132, 213, 231, 312 e 321. 


Sinal (paridade) de uma permutação 


Considere uma permutação arbitrária o de S,, digamos, 0 = Jij> *::J,- Dizemos que o é uma permutação par ou ím- 
n 2 n 
par se existir um número par ou ímpar de inversões em o. Por uma inversão em o entendemos um par de inteiros (i, 


k) tais que i > k, mas com i precedendo k em o. Então definimos o sinal ou a paridade de g, e escrevemos sgn 0, por 


1 seg é par 
sgn o = o 
—l se gé ímpar 


Exemplo 8.6 


(a) Encontre o sinal de o = 35142 em S,. 
Para cada elemento k, contamos o número de elementos i tais que i > k, mas com i precedendo k em ø. 
Temos 
2 números (3 e 5) maiores do que e precedendo 1, 
3 números (3, 5 e 4) maiores do que e precedendo 2, 
1 número (5) maior do que e precedendo 4. 


(Não existem números maiores do que e precedendo 3 e 5.) Como há um total de seis inversões, o é par e sgn 
c=1. 


(b) A permutação identidade e = 123...n é par, pois não há inversões em e. 

(c) Em $,, a permutação 12 é par e 21 é ímpar. Em S,, as permutações 123, 231, 312 são pares e as permutações 
132, 213, 321 são ímpares. 

(d) Seja t a permutação que troca de posição os dois números i e j, deixando os demais fixos. Ou seja, 


T(i) =j, t(j) =i, t(k) =k, com k — bj 
Dizemos que 7 é uma transposição. Se i < j, então existem 2(j — i) — 1 inversões em te, portanto, a transpo- 
sição t é ímpar. 


OBSERVAÇÃO Podemos mostrar que, dado qualquer n, a metade das permutações de S, são pares e a outra me- 
tade são ímpares. Por exemplo, 3 das 6 permutações de S, são pares e 3 são ímpares. 


8.5 DETERMINANTES DE ORDEM ARBITRÁRIA 


Seja A = [a;] uma matriz quadrada de ordem n sobre um corpo K. 
Considere um produto de n elementos de A tal que um, e apenas um, desses elementos vêm de cada linha e um, 
e apenas um, vêm de cada coluna. Um tal produto pode ser escrito na forma 


MD Onja 
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em que os fatores pertencem a linhas sucessivas, sendo os primeiros de seus dois índices na ordem natural 1, 2, ..., 
n. Agora, como os fatores vêm de colunas diferentes, a sequência dos segundos de seus dois índices forma uma 
permutaçãoo =, Jz `- “jade S,. Reciprocamente, cada permutação de S, determina um produto desse tipo. Assim, 
a matriz A fornece n! desses produtos. 


DEFINIÇÃO O determinante de A = [a;], denotado por det(A) ou |A], é a soma de todos os n! produtos descritos 
acima, sendo cada um desses produtos multiplicado por sgn øg, isto é, 


|A| = X (sgn Jay; az, Anj 


(o 


ou |A| = X (sgn o)aic(1)a20(2) `` ano(n) 


cEs, 


n 


Dizemos que a matriz quadrada A de ordem n tem um determinante de ordem n. 


O exemplo seguinte mostra que a definição dada coincide com as definições precedentes de determinantes de 
ordem 1,2 e 3. 


Exemplo 8.7 


(a) Seja A = [a] uma matriz 1 x 1. Como S, só tem uma permutação, que é par, det(A) = a,,, o próprio elemen- 
to. 
(b) Seja A = [a,] uma matriz 2 x 2. Em S, a permutação 12 é par e a permutação 21 é ímpar. Logo, 


4 2 
a2) do 


det(4) = = 411422 — 412471 


(c) Seja A = [a,] uma matriz 3 x 3. Em S, as permutações 123, 231, 312 são pares e as permutações 321, 213, 
132 são ímpares. Logo, 


a&i) do di 
det(4) = |a an ay |= 4d11422433 + 412423431 + 413421432 — 413422431 — 412421433 — 411423432 
dy da 433 


OBSERVAÇÃO Quando n cresce, o número de termos no determinante se torna astronômico. Por isso, usamos 
métodos indiretos para calcular determinantes em vez da definição de determinante. Na verdade, demonstramos 
várias propriedades dos determinantes que nos permitem simplificar consideravelmente as contas. Em particular, 
mostramos que um determinante de ordem n é igual a uma combinação linear de determinantes de ordem n — 1, 
como no caso n = 3 já visto. 


8.6 PROPRIEDADES DE DETERMINANTES 


Vejamos as propriedades básicas do determinante. 


A| = [4], 


Teorema 8.1 O determinante de uma matriz A coincide com o de sua transposta A”, isto é, 


Com esse teorema (demonstrado no Problema 8.22), vemos que qualquer teorema sobre o determinante de 
uma matriz A relacionado com as linhas de A tem um teorema análogo relacionado com as colunas de A. 

O teorema seguinte (demonstrado no Problema 8.24) apresenta certos casos em que o determinante pode ser 
obtido imediatamente. 


Teorema 8.2 Seja A uma matriz quadrada. 


Gi) Se A tem uma linha (coluna) de zeros, então |A| = 0. 
(ii) Se A tem duas linhas (colunas) idênticas, então |A| = 0. 
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(iii) Se A é triangular, isto é, se A possui zeros acima ou abaixo da diagonal, então |A| é igual ao 
produto dos elementos diagonais. Assim, em particular, |7| = 1, sendo 1 a matriz identidade. 


O teorema seguinte (demonstrado nos Problemas 8.23 e 8.25) mostra como o determinante de uma matriz é 
afetado pelas operações elementares com as linhas e as colunas. 


Teorema 8.3 Suponha que B seja obtida a partir de A por uma operação elementar com as linhas (colunas). 
(i) Se duas linhas (colunas) trocaram de posição, então |B| = —/4]. 
(ii) Se uma linha (coluna) de A foi multiplicada por um escalar k, então |B| = k|A|. 


(iii) Se um múltiplo de uma linha (coluna) de A foi somado a uma outra linha (coluna) de 4, então 
|B| = |A]. 
Propriedades principais dos determinantes 


Enunciamos, agora, duas das mais importantes e úteis propriedades de determinantes. 


Teorema 8.4 O determinante de um produto de duas matrizes A e B é o produto de seus determinantes, isto é, 
det(4B) = det(4) det(B) 
Esse teorema afirma que o determinante é uma função multiplicativa. 


Teorema 8.5 Seja A uma matriz quadrada. São equivalentes as afirmações dadas. 
(i) A éinvertível, isto é, A possui uma inversa a: 
(11) AX = 0 possui apenas a solução nula. 
(iii) O determinante de A é não nulo, isto é, det(4) # 0. 


OBSERVAÇÃO Dependendo do autor e do texto, uma matriz não singular A é definida como uma matriz inver- 
tível, ou como uma matriz A para a qual |4| # 0, ou como uma matriz A tal que AX = 0 só tem a solução nula. O 
teorema precedente mostra que todas essas definições são equivalentes. 


Demonstramos os Teoremas 8.4 e 8.5 (nos Problemas 8.29 e 8.28, respectivamente) utilizando a teoria de ma- 
trizes elementares e o lema seguinte (demonstrado no Problema 8.26), que é um caso especial do Teorema 8.4. 


Lema 8.6 Seja E uma matriz elementar. Então, dada qualquer matriz A, |E4| = |E||A]. 


Vimos que duas matrizes A e B são semelhantes se existir uma matriz não singular P tal que B = PAP. 
Usando a propriedade multiplicativa do determinante (Teorema 8.4), pode-se demonstrar facilmente (Problema 
8.31) o teorema seguinte. 


Teorema 8.7 SeA eB são matrizes semelhantes, então |4| = |B]. 


8.7 MENORES E COFATORES 


Considere uma matriz quadrada A = [a,] de ordem n. Denotemos por M; a submatriz de A de ordem (n — 1) obtida 
suprimindo sua i-ésima linha e sua j-ésima coluna. O determinante |M; é denominado menor do elemento a, de A 
e o cofator de a,, denotado por A,, É o menor com “sinal”, como segue. 


Aij = (DM, 
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. x i+ij 5 A 
Observe que os “sinais” (—1)' ~” que acompanham os menores formam um padrão de tabuleiro de xadrez com o 
sinal da soma na diagonal. 


Enfatizamos que M, denota uma matriz, enquanto A, denota um escalar. 


OBSERVAÇÃO Frequentemente, o sinal (-1) "* do cofator A, é obtido com o padrão do tabuleiro de xadrez. Mais 
precisamente, começamos com o sinal da soma e alternamos o sinal, ou seja, 


GI = qa 


contando da diagonal principal para a casa apropriada do tabuleiro. 


123 
Exemplo 8.8 Seja4= | 4 5 6 |.Encontre os menores e os cofatores seguintes. (a) |M,3|e 423, (b) |M3; |e 431- 
7809 
123 19 
(a) IMnl=|4 5 6|= =8-14=-6, e, portanto, A4» = (1º |M] = —(-6) = 6 
7 8 
7 8 9 
123 23 
b) IM|=H 5 6|= = 12 — 15 = —3, e, portanto, 43, = (—-1)'“IM,| = +(-3) = —3 
1 8 9 + 6 


Expansão de Laplace 


Vale o teorema seguinte (demonstrado no Problema 8.32). 


Teorema 8.8 (Laplace) O determinante de uma matriz quadrada A = [a,] é igual à soma dos produtos obtidos 
multiplicando os elementos de qualquer linha (coluna) por seus respectivos cofatores. 


|A| = ann + apÃp +": + anmin = DMA; 
1 


|A| = ajA dojÃo; Ee A= Da 


Essas fórmulas para |A| são denominadas expansões de Laplace do determinante de A pela i-ésima linha e 
j-ésima coluna. Junto com as operações elementares com as linhas (colunas), oferecem um método para simplificar 
o cálculo de |A|, conforme veremos. 


8.8 CÁLCULO DE DETERMINANTES 


O algoritmo seguinte reduz o cálculo de um determinante de ordem n ao cálculo de um determinante de ordem 
n= l. 


Algoritmo 8.1 (Redução de ordem de um determinante) É dada uma matriz não nula A = [a;] quadrada de ordem 
n,comn> l1. 
Passo 1 Escolha um elemento a, = 1 ou, na falta desse, a; 0. 


Passo 2 Usando a, como pivô, use operações elementares com as linhas (colunas) para colocar zeros em todas as 
outras posições da coluna (linha) contendo a, . 


Passo 3 Expanda o determinante pela coluna (linha) contendo a, . 
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Destacamos as observações seguintes. 


OBSERVAÇÃO 1 O Algoritmo 8.1 costuma ser usado para determinantes de ordem 4, ou superior. Para determi- 
nantes de ordem menor do que 4, usamos as fórmulas específicas para o determinante. 


OBSERVAÇÃO 2 A eliminação gaussiana ou, equivalentemente, o uso repetido do Algoritmo 8.1, junto com tro- 
cas de linhas, podem ser usados para transformar uma matriz A numa matriz triangular superior cujo determinante 
seja o produto de suas entradas diagonais. Contudo, devemos manter um registro do número de trocas de linhas, já 
que cada troca de linha troca o sinal do determinante. 


5 4 2 1 

: 2 3 1 -2 

Exemplo 8.9 Use o Algoritmo 8.1 para calcular o determinante de 4 = | 5 7 3 9 
1 -2 -l1 4 


Usamos a,, como pivô e colocamos zeros nas outras posições da terceira coluna, isto é, aplicamos as operações 
elementares com as linhas “Substituir R, por -2R, + R,”, “Substituir R, por 3R, + R,” e “Substituir R, por R, + 
R}. Pelo Teorema 8.3(iii), o valor do determinante não se altera com essas operações. Assim, 


5 4 2 1 1 -2 0 5 
4| = 2 3 1 =2 = 2 3 1 2 
=5 =7 =3 9 1 2 0 3 
1 =2 =l 4 3 1 0 2 
Agora, expandimos a terceira coluna. Mais precisamente, suprimimos todos os termos iguais a zero e usamos o fato 
de que o sinal do menor M,, é(=1)7 = —1. Assim, 
12 
PE: i = E 
a=- 2 0 3571 2 3ļ|= -(4-— 18+ 5-30 -3 + 4) = -(—38) = 38 
3 12 
3 10 2 


8.9 ADJUNTA CLÁSSICA 


Sejam A = [a] uma matriz n x n sobre um corpo K e 4, o cofator de a,. A adjunta clássica de A, denotada por 
adj 4, é a transposta da matriz de cofatores de 4, a saber, 


adj A = [4] 


Dizemos “adjunta clássica”, em vez de simplesmente “adjunta”, porque, hoje me dia, o termo “adjunta” é utilizado 
para um conceito totalmente diferente (ver Capítulo 13). 


Exemplo 8.10 Seja 4 = : E z . Vejamos os cofatores dos nove elementos de A. 
1 =l 5 
An =+ = |--I8 Ap =| JA an= RE 
Ag="[ “Sn, An = + Sá An = J= 
daH à 3|=-10, Ay = o = -4 45 =+ 4 
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A transposta da matriz dos cofatores fornece a adjunta clássica de A, ou seja, 


-18 —11 —10 
adj4=| 2 14 —4 
4 5 -8 


Vale o teorema seguinte (demonstrado no Problema 8.34). 


Teorema 8.9 Seja A uma matriz quadrada qualquer. Então 
A(adj A) = (adj AJA = |AII 


onde 1 é a matriz identidade. Assim, se |4| # 0, 


- É 
A =p TA 


Exemplo 8.11 Seja A a matriz do Exemplo 8.10. Temos 


det(4) = —40 + 6 +0 — 16 +4 + 0 = —46 


Assim, A possui uma inversa e, pelo Teorema 8.9, 


9 11 
| [uno [4 4á 
-1 _ g = 1 2 
A = 4 05 4) = — 46 2 14 —4 = -73 A 23 
2 5 4 
4 5 =B -3 T% B 


8.10 APLICAÇÕES A EQUAÇÕES LINEARES, REGRA DE CRAMER 


Considere um sistema AX = B de n equações lineares com n incógnitas. Seja A = [a,] a matriz (quadrada) de coe- 
ficientes e B = [b,] o vetor coluna dos termos constantes. Seja A, a matriz obtida de A substituindo a coluna i de A 
pelo vetor coluna B. Além disso, denotemos 


D=det(4),  N=det(4)),  N=det(A4), o N, = det(4,) 
A relação fundamental entre esses determinantes e a solução do sistema AX = B é dada no teorema a seguir. 
Teorema 8.10 O sistema (quadrado) AX = B possui uma única solução se, e só se, D 0. Nesse caso, a única 
solução é dada por 
NM, N, N, 
== X, = -A is = 
1 D 7 2 D , 
Esse teorema (demonstrado no Problema 8.35) é conhecido como Regra de Cramer para a resolução de siste- 
mas de equações lineares. Enfatizamos que o teorema apenas se refere a sistemas com o mesmo número de equa- 
ções e incógnitas, e apenas fornece a solução no caso D Æ 0. De fato, se D = 0, o teorema não nos diz se o sistema 


possui solução, ou não. Contudo, no caso de um sistema homogêneo, temos o resultado útil seguinte (demonstrado 
no Problema 8.54). 


Teorema 8.11 Um sistema homogêneo quadrado AX = 0 tem alguma solução não nula se, e só se, D = |A| = 0. 
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x+ y+ z= 5 


Exemplo 8.12 Usando determinantes, resolva o sistema § X— 2y — 3z = -1 
2x+ y- z= 3 


Em primeiro lugar, calculamos o determinante D da matriz de coeficientes. 


| 1 1 
D=|1 2 3|=2-6+1+4+3+1=5 
2 1 — 


Como D # 0, o sistema tem solução única. Para calcular N, N,, N, substituímos, respectivamente, os coeficientes de 
x, y, z na matriz de coeficientes pelos termos constantes, obtendo 


5 1 1 1 5 1 1 1 
N.=|-—1 2 3| = 20, N,=]|1 1 3 /==10, N =|] 2 1|=15 
3 Jo =] 2 É =l 1 


Assim, a solução única do sistema é x = N,/D = 4, y = N,/D = —2, z= N,/D = 3; ou seja, o vetor u = (4,-2,3). 


8.11 SUBMATRIZES, MENORES E MENORES PRINCIPAIS 


Seja A = [a,] uma matriz quadrada de ordem n. Consideremos quaisquer r linhas e r colunas de A. Mais precisa- 
mente, consideremos um conjunto 7 = (i,,i>,...,i,) qualquer de r índices de linha e um conjunto 
J = (j1,J2,---+j,) qualquer de r índices de coluna. Então 7 e J definem uma submatriz r x r de A, denotada por 
A(I; J), obtida suprimindo todas as linhas e colunas de A cujos índices não estão, respectivamente, em Z ou J, res- 
pectivamente. Assim, 


AI; J) = jag: sEI,t EJ] 
Dizemos que o determinante |4 (7; J)| é um menor de A de ordem r e 


(-1)* Hot +i, tj tjt +j, 


A(I;J)| 


é o correspondente menor com sinal. (Observe que um menor de ordem n — 1 é um menor conforme definimos na 
Seção 8.7, e o menor com sinal correspondente é um cofator.) Além disso, Se 7’ e J’ denotam, respectivamente, os 
índices de linhas e colunas restantes, então 


|A’) 
denota o menor complementar e seu sinal (Problema 8.73) é igual ao sinal do menor. 


Exemplo 8.13 Seja A = [a,] uma matriz quadrada de ordem 5 e sejam 1 = {1, 2, 4} e J = {2, 3, 5}. Então 
T = {3,5}e J! = {1,4}, e o menor |M] e o menor complementar |M'| são dados a seguir. 


dj ds dis f o 
IM|=I4(1;))|=|a» as as e |M'| = A(O] = 


a42 A43 das 


à31 @34 
d5] s54 


Comol +2 +4+2 +3 +5 = 17 é ímpar, -|M| é o menor com sinal e —|M'|é o menor complementar com sinal. 


Menores principais 


Dizemos que um menor é principal se os índices de linha e coluna são os mesmos ou, equivalentemente, se os 
elementos diagonais do menor são elementos diagonais da matriz. Observamos que o sinal de um menor principal 
é sempre +1, porque a soma dos índices de linhas e dos mesmos índices de colunas é sempre par. 
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12 =] 
Exemplo 8.14 Seja 4 = 3 5 4 |. Calcule as somas C,, C, e C, dos menores principais de ordens 1, 2 e 3, 
=3 1 =2 
respectivamente. 


(a) Temos três menores principais de ordem 1, a saber, 
H|=1, 5|=5, |- 2| =—2, e,portanto, Cj=1+5-2=4 
Observe que C, é, simplesmente, o traço de 4, ou seja, C, = tr(A). 


(b) Temos três maneiras de escolher dois dentre os três elementos diagonais e cada escolha destas fornece um 
menor de ordem 2, a saber, 


12 
3 5 


1 = 


|=-1, 3 A 


ai i 4 


= —14 
1 =2 | 
(Observe que esses menores de ordem 2 são os cofatores A,,, A,, € 4, de A, respectivamente.) Assim, 


G=-1+1-14=-14 


(c) Temos somente uma maneira de escolher três dentre os três elementos diagonais. Logo, o único menor de 
ordem três é o próprio determinante de A. Assim, 


G = |A| = -10 -24 -3 — 15 — 4 + 12 = —44 


8.12 MATRIZES EM BLOCOS E DETERMINANTES 


O principal resultado desta seção é o teorema seguinte (demonstrado no Problema 8.36). 


Teorema 8.12 Seja M uma matriz triangular superior (inferior) em blocos com blocos diagonais 4,, A,, ..., A,. Então 


det(M) = det(A4,) det(4,) - - - det(4,) 


2 3,4 78 

E 

Exemplo 8.15 Calcule |M|, sendo M = 0 0 2 15 
0 0,13 —1 4 

0 0'5 2 6 


Observe que M é uma matriz triangular superior em blocos. Calculamos o determinante de cada bloco diagonal. 


5'5 2 15 
=10+3 = 13, 3 —1 4]=-124+204304+25-16-18=29 
Ee É 5 2 6 


Então |M| = 13(29) = 377. 


A , em que A, B, C, D são matrizes quadradas. Não é válido em 
C D geral que 


|M] = |A||D| — |B||C|. (Ver Problema 8.68.) 


OBSERVAÇÃO Seja M = 


8.13 DETERMINANTES E VOLUME 


O conceito de determinante está relacionado com os conceitos de área e volume, como segue. Sejam u,, Uz, ..., U 
vetores de R”. Seja S o paralelepípedo (sólido) determinado por esses vetores, isto é, 


n 


S = {au + azu ++: + a,n : 0 <a; < l,comi= 1,...,n} 


(No caso n = 2, S é um paralelogramo.) Denotemos por V(S) o volume de S (ou a área de S, se n = 2). Então 
VCS) = valor absoluto de det(A) 
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onde A é a matriz de linhas u, u,, ..., u,. Em geral, V(S) = O se, e só se, os vetores u, u,, ..., u, não formam um 
sistema de coordenadas para R” (ou seja, se, e só se, os vetores são linearmente dependentes). 


Exemplo 8.16 Sejamu, = (1,1,0), u, = (1,1,1), u, = (0,2,3). Encontre o volume V(S) do paralelepípedo S 
de Rº (Figura 8-2) determinado por esses três vetores. 


Figura 8-2 


Calculamos o determinante da matriz cujas linhas são u,, u,, u,. Temos 


Portanto, V (S) = | — 2| = 2. 


8.14 DETERMINANTE DE UM OPERADOR LINEAR 


Seja F um operador linear de um espaço vetorial V de dimensão finita. Seja A a representação matricial de F em 
relação a alguma base S de V. Então definimos o determinante de F, denotado por det(F), por 


det(F) = |A| 


Se B for uma outra representação matricial de F em relação a alguma outra base S’ de V, então A e B são matrizes 
semelhantes (Teorema 6.7) e |A| = |B| (Teorema 8.7). Em outras palavras, a definição de det(F) independe da par- 
ticular escolha da base S de V. (Dizemos, então, que este conceito está bem definido). 


O teorema seguinte (demonstrado no Problema 8.62) segue de teoremas análogos para matrizes. 


Teorema 8.13 Sejam Fe G operadores lineares de um espaço vetorial V. Então 
(i) det(Fo G) = det(F) det(G). 
(ii) F é invertível se, e só se, det(F) 0. 


Exemplo 8.17 Sejam F o operador linear de R? dado e A a matriz que representa F na base canônica de RÌ. 


2 —4 1 
F(x, y,z) = (2x — 4y +z, x — 2y + 3z, 5x +y- 2) e A=|1 -2 3 
5 1 —1 


Então 


det(F) = |A| = 4—60 + 1 +10 — 6- 4= -55 
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8.15 MULTILINEARIDADE E DETERMINANTES 
Seja V um espaço vetorial sobre um corpo K e denotemos por ./ = V”; o conjunto de todas ênuplas 
A = (A;, Á, ... A) 


em que os 4, são vetores de V. Temos as definições seguintes. 


DEFINIÇÃO Dizemos que uma aplicação D:./ — K é multilinear se for linear em cada componente, como segue. 
G) Se 4; = B + C, então 


D(4) = D(..., B+C, ..) = D(...,B,...,)+D(..,C,...) 
(ii) Se 4, = kB, com k € K, então 
D(A) = Dhore kB psi) = Macs asse) 
Aplicações multilineares com n componentes também são ditas n-lineares e, em particular, com n = 2, bilineares. 


DEFINIÇÃO Dizemos que uma aplicação D:./ — K é alternada se D(A) = O em cada A com dois elementos 
iguais, ou seja, 
D(A,,42,...54n) = 0 SE 4; = Á; i#j 


Seja, agora, M o conjunto de todas as matrizes quadradas A de ordem n sobre um corpo K. Podemos ver A como 
uma ênupla consistindo nos vetores linha A, A,, ..., A, de A, isto é, podemos ver A no formato A = (A,, A,,...,4,). 


O teorema seguinte (demonstrado no Problema 8.37) caracteriza a função determinante. 


Teorema 8.14 Existe uma única função D: M 5 K D: M > K tal que 
G) D é multilinear, Gi) D é alternada, Gi) D(D = 1. 


Essa função D é a função determinante, ou seja, D(A) = |A], para qualquer matriz 4 € M. 


Problemas Resolvidos 


Cálculo de determinantes 


8.1 Calcule o determinante de cada uma das matrizes seguintes. 
02 2 =3 4 —5 t—5 6 


, a 
Usamos a fórmula 


gl=ad-te 

(a) |4]|=6(3)-5(2)=18-10=8 

(b) |B|=14+12=26 

(0) |cj=-8-5=13 

(d) |Dl=(t-5S)(t+2)-18=? -3t-10-18=? — 10t — 28 


8.2 Calcule o determinante de cada uma das matrizes seguintes. 


2 34 i =2 3 1 3 -5 
() 4=|5 4 3|, B=|2 4 1l, © cC=|3 -1 2 
121 1 5 -2 1 -2 à 
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Usamos o diagrama da Figura 8-1 para obter os seis produtos. 
(a) |A| =2(4)(1) +3(3)(1) + 4(2)(5) — 1(4)(4) — 2(3)(2) — 1(3)(5) = 8 + 9 + 40 — 16 — 12 —15 = 14 
(b) |B|=-8+2+4+30-12+5-8=9 
(co) [Cl=-1+6+30-5+4-9=25 


8.3 Calcule o determinante de cada uma das matrizes seguintes. 


4 6 8 9 l i 
Ly =l 
234 0-2 7 3 a 
(a) 4=]5 67,0 B=] 05 PO C| 51 
891 0 00 3 1 —4 1 


(a) Podemos simplificar as entradas subtraindo da segunda linha o dobro da primeira, isto é, usando a 
operação sobre as linhas “Substituir R, por -2R, + R,”. Então 


234 23 4 
Ml=|5 6 T|=|1 0 -1/=0-24436-0+18-3=27 
8 9 1 8 9 1 
(b) B é triangular, portanto, |B| = produto das entradas diagonais = —120. 


(c) Eliminando as frações, simplificamos as contas. Por isso, multiplicamos a primeira linha R, por 6 e a segunda linha 
R, por 4. Então 


20 a 28 7 
pacj=|3 2 —4]=6+24+24+4-48+18=28, portanto |Cl=5=- 
i -4 q 


8.4 Calcule o determinante de cada uma das matrizes seguintes. 


SE e 6 2 1 0/5 
E e 2 11-21 
GA o b® =| 1 1 27-2 3 
ae a É 3 0 2 3 -1 


=] =1 =3 4 2 


a) Usamos a,, = 1 como pivô para colocar zeros na primeira coluna, aplicando as operações sobre as linhas “Substituir 
31 pIVO p p p peraç 
R, por -2R, + Rj”, “Substituir R, por 2R, + R,” e “Substituir R, por R, + R,”. Então 


2 5 -3 2) Bd 16 
-1 1 -6 

203 2 -5| |o 3 -2 -I 
|= = =| 3 -2 -1 

1 3 —2 2| [MEME 
=8 27.8 

1-6 4 3| Ss 2 5 


= 10 +3 — 36 +36 — 2 — 15 = —4 


(b) Primeiro reduzimos |B| a um determinante de ordem 4 e depois a um de ordem 3, no qual podemos usar o diagrama 
da Figura 8-1. Usamos b,, = 1 como pivô para colocar zeros na segunda coluna, aplicando as operações sobre as 
linhas “Substituir R, por -2R, + R,”, “Substituir R, por -R, + R,” e “Substituir R, por R, + R$”. Então 


20 E] 4 3 
e E E: 1 14 5 
Joib E 
=i io 3 © i10 0 
Bl=|[-10 1 o 2|= = 
3 F = s W s — 
3 0 W 3 
1 -2 2 3|) |- 82 7 
10 BM 23 
14 5 
=| 5 3 =—5|=21+20+ 50+ 15+ 10-— 140 = —34 
=] 2. q 
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Cofatores, adjuntas clássicas, inversas 


2 1 -3 4 
o [5 -4 7-2 
8.5 Sja4=|4 0 63 


3 -2 5 2 
(a) Encontre A,,, o cofator (menor com sinal) de 7 em A. 
(b) Encontre o menor e o menor com sinal da submatriz M = A(2, 4; 2, 3). 


(c) Encontre o menor principal determinado pelas primeira e terceiras entradas diagonais, isto é, por M = 


A(1,3; 1,3). 
(a) Tomamos o determinante da submatriz de A obtida suprimindo a linha 2 e a coluna 3 (as que tem o 7) e 
multiplicamos o determinante por (—1 jr 
2 1 4 
An = — 0 -3)=-(-61) = 61 
3 =2 2 


O expoente 2 + 3 vem dos índices de A,,, ou seja, do fato de o 7 aparecer na linha 2 e coluna 3. 


(b) Os índices das linhas são 2 e 4 e os das colunas são 2 e 3. Logo, o menor é o determinante 


m= [0 em E I| =-20+14= -6 
42 443 
e o menor com sinal é (—1) +P |M| = -|M| = —(—6) = 6. 
(c) O menor principal é o determinante 
IM| = “i anj]? =3 = 12 + 12 = 24 
d3) a33 4 6 


Observe que as entradas diagonais da submatriz são as entradas diagonais da matriz original. Também, o sinal do 
menor principal é positivo. 


1 1 1 
8.6 SejaB = |2 3 4|.Encontre (a) |B|, (b)adj B, (c) BT!, usando adj B. 
5 8 9 


(a) |B|=27+20+16-15-32-18=-2 


(b) Queremos a transposta da matriz de cofatores 


3 4 2 4 2-317 
n 2? o8 -5 2 to f-5 -1 i 
11 11l 11 
adj B = |- = =l- 4 3|=| 2 4 2 
8 9 5 9 5 8 
1 1l 1a 1a + sã dq RES a 
34) |24 33 
i phet d h a 
(c) Como|B| £ 0, temos B! = — (adj B) = 2 4 2|= 1 -2 1 
|B| -2]) 1 -3 1] T A 
E 2 3 


8.7 Seja 4 = . Encontre a soma S, dos menores principais de ordem k de A nos casos 


o pm 
NAN 
o O w 


(a) k=1, (b) k=2, (©) k=3. 
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(a) Os menores principais de ordem 1 são os elementos da diagonal. Assim, S, é o traço de A, ou seja, 


Sı =tr(4)=1+5+8=14 


(b) Os menores principais de ordem 2 são os cofatores dos elementos diagonais. Assim, 


5 6 1 3 1 2 
Sz = Ay +42 +433 = 


+ + =-2+8-3=3 
o 8| |4 | 


(c) Só há um menor principal de ordem 3, o determinante de A. Então 


S; = |A| = 40 +0 +84 — 0 — 42 — 64 = 18 


1 3 0 -1 
i 4 2 5 1 ; n ia 
8.8 Seja 4 = 1 03 2 . Encontre o número N, e a soma S, dos menores principais de ordem 
3 -2 1 4 


(a) k= 1, (b)k = 2, (c)k = 3, (d) k= 4. 
Cada subconjunto (não vazio) da diagonal ou, equivalentemente, cada subconjunto (não vazio) de {1, 2, 3, 4}, 


| 
determina um menor principal de A, sendo N, = (G ) = Te desses de ordem k. Assim, 
n 


TK)! 


v(e nl ml G) 


(a) Si =|| + |2| +3] +]4|=1+2+3+4=10 
l 3 1 0 1 — 2 5 21 3 =2 
(b) S = 
-4 2| j1 3| l3 al lo 3| l-2 4| l1 4 
= 144+3+7+46+104+14=54 
13 0 1 3 -1 1 0 —1 2 5 1 
©) S=|-4 2 5|+|-4 2 ill 3 -2l+| 0 3 -2 
1 0 3 3 —2 4 3 1 4 —2 1 4 


= 57 +65 +22 + 54 = 198 
(d) S, = det(4) = 378 


Determinantes e sistema de equações lineares 


3y +2x=z+1 
8.9 Use determinantes para resolver o sistema į 3x + 2z = 8 — 5y. 
3z — l = x — 2y 


Primeiro arranjamos a equação no formato padrão, depois calculamos o determinante D da matriz de coeficientes. 


2x+3y— z= 1 2 
3x + 5y +2z= 8 e D=|3 5 2| = —30+6+6+5+8+27= 22 
x — 2y — 3z = —1 1 


Como D 0, o sistema tem solução única. Para calcular N, N, N, substituímos, respectivamente, os coeficientes de x, 
y, z na matriz de coeficientes pelos termos constantes. Então 


1 3 =] 2 1 — 2 3 l 
N=|8 5 2|= 66, N,=|3 8 2|=-22, N,=|3 5 8|=44 
=] =2, =] Lo =1, -—3 1 =2 =l 


288 
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Assim, 
NM 66, NM | ONO M 
D 2 é Op ag > ra 
kx+y+z=1 
8.10 Considere o sistema 4 x + ky +z = 1 
x+y+kz=1 


Use determinantes para encontrar os valores de k com os quais o sistema tem 
(a) solução única, (b) mais de uma solução, (c) nenhuma solução. 


(a) O sistema tem solução única se D Æ 0, onde D é o determinante da matriz de coeficientes. Calculamos 


D= =K +1+1-k-k-k=k —3k+2= (k-17 (k+2) 


a = y 


1 
k 
1 


xee 


Assim, o sistema tem solução única se 
(k— 1) (k +2) #0, ou seja, sekż1 e k#2 


(b e c) A eliminação gaussiana mostra que o sistema tem mais de uma solução se k = 1 e que o sistema não tem solução 
sek=2. 


Problemas variados 


8.11 Encontre o volume V(S) do paralelepípedo S de Rº determinado pelos vetores dados. 
(a) u =(1,1,1),u, = (1,3, —4), u; = (1,2, —5). 
(b) u] = (1,2,4), u = (2, l; —3), u3 = (5, 7,9). 


VCS) é o valor absoluto do determinante da matriz M cujas linhas são os vetores dados. Assim, 


11 1 
@ fe (dl. 3 -4| =-15-4+2-3+8+5 = -7.Logo, V (S) =|-7|=7. 
l 2. =5 
1 2 4 
(b) |M|=|2 1 —=3|= 9 -— 30 + 56 -— 20 + 21 — 36 = 0. Assim, V(S) = 0 ou, em outras palavras, u,, 4,, 4, são 
S7 9 


coplanares e linearmente dependentes. 


34000 3 41010 0 
25000 2 5'0'0 0 
8.12 Encontre det(M),com M = |0 9 2 0 0|=I|0 91210 0 
05067 051076 7 
00434 0 01413 4 


M é uma matriz triangular (inferior) em blocos, logo, calculamos o determinante de cada bloco. 


6 7 


3 4 


3 4 
2 5 


|=15-8=7, 2|=2, | [-m-21=3 
Assim, |M| = 7(2)(3) = 42. 
8.13 Encontre o determinante do operador F: R? — R? dado por 


F(x,y,z)= (x + 3y — 42, 2y+72, x + 5y — 32) 
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O determinante de um operador linear F é igual ao determinante de qualquer matriz que represente F. Por isso, primeiro 
calculamos a matriz que representa F na base canônica, cujas linhas consistem nos coeficientes de x, y, z, respectiva- 
mente. Então 


1 3 
A=|0 2 7|, e, portanto, det(F)= |A| = —6 +21 + 0+8 -235-0 = -8 
1 5 


8.14 Escreva explicitamente g = g(x, X2, X3, X4), sendo, em geral, 


g(x, X2, Rn Xn) = LI; o x). 
i<j 
O símbolo | | é usado para um produto de termos, da mesma forma que o símbolo >: é usado para uma soma de termos. 


Logo, Hi; (x; — x) significa o produto de todos termos (X; — x;) para os quais i < j. Assim, 


g=8(%,...,x4) = (x — x2) (x1 — x3) (xy — x4) (02 — x3) (x2 — x4) (x3 — x4) 


8.15 Seja D uma aplicação bilinear alternada. Mostre que D(4, B) = —D(B, A). 
Sendo D é alternada, D(4, A) = 0, D(B,B) = 0. Logo, 
D(4 + B,A + B) = D(A, A) + D(A, B) + D(B,4) + D(B,B) = D(A, B) + D(B,4) 
No entanto, D(A + B, A + B) = 0. Assim, D(4, B) = —D(B, A), como queríamos mostrar. 


Permutações 


8.16 Encontre a paridade (sinal) da permutação o = 364152. 


Contamos o número de inversões, ou seja, para cada elemento k, contamos o número de elementos i de o tais que i > k 
e i precede k em o. Temos 


k=1: 3 números (3, 6, 4) k=4: 1 número (6) 
k=2: 4números (3, 6,4,5) k = 5: 1 número (6) 
k = 3: 0 números k = 6: O números 


Como3 +4+0+1+1+0 = 9 é ímpar, o é uma permutação ímpareo = —1. 


8.17 Sejam o = 24513 e t = 41352 permutações de S,. Encontre (a) to o, (b)o |. 


Lembre que o = 24513 e t = 41352 são maneiras concisas de escrever 


s=; i o) ou o(l)=2, o(2)=4, c(3)=5, o(4)=1, a(5)=3 


tn 


= (4 r , E 5.) ou  qt(1)=4, (D=1, (3)=3, (4)=5, 1(5)=2 


(a) Efetuando o e depois t em 1, 2,3, 4, 5, obtemos 
1=52+>1, 25455, 3>55>2, 45154, 55353 
[Isto é, por exemplo, (To 0)(1) = T(o(1)) = 7(2) = 1] Assim, To o = 15243. 
(b) Por definição, o !(j) = k se, e só se, a(k) = j. Logo, 


ALA E A BN /12345 Ea 
Rs pi ou OTER 


8.18 Sejao = jı J2 - - -Jn uma permutação qualquer de S,. Mostre que, para cada inversão (i, k) com i > k, mas i 
precedendo k em øg, existe um par (1*,)*) tal que 


E <Kk* e a(i*) > o( j*) (1) 


e vice-versa. Assim, o é par ou ímpar, dependendo de existir um número par ou ímpar de pares satisfazendo (1). 
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Escolhemos i* e k* dados por o(i*) = ie o(k*) = k. Então i > k se, e só se, o(i*) > o(k*),e i precede k emo se, 
e só se, i* < k*. 


8.19 Considere os polinômios g = g(x,...,X,)e a(g), definidos por 
E= g(x, des Xn) = L; E x;) E o(g) = Hæ T Xo(j)) 
i<j i<j 


(Ver Problema 8.14.) Mostre que o(g) = g se g for uma permutação par e O (g ) = —8, se 6 for uma permutação ím- 


par, ou seja, o(g) = (sgn 0)g. 
Como ø é injetora e sobre, 


ole) = Hey —*())= II œa) 
i<j i<j ou i>j 


Assim, o(g) ou o(g) = —g, dependendo de existir um número par ou ímpar de termos da forma x, — x,, com i > j. Ob- 
serve que, para cada par (i, j) para o qual 


i<j e a(i) > o(j) (1) 


existe um termo (X,(; — Xs(j)) em a(g) para o qual a(i) > o(j). Como ø é par se, e só se, existir um número par de 
pares satisfazendo (1), temos o(g) = g se, e só se, g é par. Assim, o(g) = —g se, e só se, o é ímpar. 


8.20 Sejamo,7T € S,. Mostre que sgn(tº 0) = (sgn T)(sgn 0). Assim, o produto de duas permutações pares ou 
ímpares é par e o produto de uma permutação par por uma ímpar é ímpar. 


Usando o Problema 8.19, temos 


sgn(ro o) g = (t° o)(g) = t(o(g)) = t((sgn o)g) = (sgn T)(sgn o)g 
Por isso, sgn (To 0) = (sgn T)(sgn o). 


1 


8.21 Considere a permutação o = j1 Jz ` ` -jn- Mostre que o” = sgn o e que, dados escalares a, mostre que 


a; 145,2 o “Gn = aik ok, o “Ink, 
onde o7! = kk, +- + k. 
Temos g™! o g = g, a permutação identidade. Como € é par, o” 
sgn o™! = sgn vo. 
Como o = jijz ` + * Ja é uma permutação, 4142": Ajn T Mk Tok" Ank, Então k,, k,, ..., k, tem a propriedade 


l e g são, ambas, pares ou ímpares. Assim, 


olk)=1, o(hb)=2, ...,  o(k)=n 
Seja t = kik ---k,. Então, para i = 1,...,n, 


(a° t)(i) = o(t(i)) = o(k;) = i 


Logo, g o t = e,a permutação identidade. Assim, T = 071. 


Demonstrações dos teoremas 


8.22 Demonstre o Teorema 8.1./47| = |A]. 


Se A = [a;], então A = [b], com b; = a. Logo, 


|A| = Ð (sgn o)bioabz0) t Brotn) = D (SEN 0)ao(1),140(2)2 ° Ao(n),n 


ces, ocs, 


Seja t = go™!. Pelo Problema 8.21, sgn T = sgn g, e As 122" lo(n)n — 411(1)421(2) ` `` An(n): Logo, 


|A| = Ð (sgn T)aii)az(2) "Ane 


ES, 


8.23 


8.24 


8.25 
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Contudo, quando ø percorre todos os elementos de S,, tT = 0”! também percorre todos os elementos de S,. Assim, 
T| 

= Al. 

Demonstre o Teorema 8.3(i). Se duas linhas (colunas) de A trocaram de posição, então |B| = [A]. 


Provamos a afirmação no caso em que foram trocadas duas colunas. Seja T a transposição que troca os dois índices 
correspondente às duas colunas de A que foram trocadas. Se A = [a,]e B = [b,], então b, = aij): Logo, dada qualquer 
permutação o, 


bio()bzo(2) ` © Brnon) = Mec o) (re 0)(2) * ` An(xo o)(n) 


Assim, 
|B| = 5 (sgn 0)bi5(1)D20(2) "Prom = X (SEN OA qro o)(1)42r° 0)(2) 7 Anfo o)(n) 
ces, ocs, 
Como a transposição t é uma permutação ímpar, sgn(t° a) = (sgn t)(sgn o) = —sgno. Por isso, 
sgn o = —sgn (T° 0),e, portanto, 
|B| = — 3 [sgn(t o Jar o)(1) (xo 0)(2) “On(roo)(n) 
TES, 
Contudo, quando øg percorre todos os elementos de S,, T° g também percorre todos os elementos de S,. Assim, |B| = A]. 


Demonstre o Teorema 8.2. Seja A uma matriz quadrada. 

G) Se A tem uma linha (coluna) de zeros, então |A| = 0. 

G) Se A tem duas linhas (colunas) idênticas, então |A| = 0. 

Gii) Se A é triangular, então |A| = produto dos elementos diagonais. Assim, || = 1. 


G) Cada parcela de |A| contém um fator de cada linha e, portanto, da linha de zeros. Assim, cada parcela de |A| é nula 
e, assim, |A| = 0. 

(ii) Suponha que 1 + 1 Æ 0 em K. Trocando as duas linhas idênticas de A entre si, continuamos com a mesma matriz 
A. Logo, pelo Problema 8.23, |A| = -|A| e, portanto, |A| = 0. 

Agora, suponha que 1 + 1 = 0 em K. Então sgn o = 1, para cada o € S,. Como A tem duas linhas idênticas, 

podemos rearranjar as parcelas de |A| em pares de parcelas iguais. Como cada par é 0, o determinante de A é 0. 

(iii) Suponha A = [a,] seja triangular inferior, ou seja, as entradas acima da diagonal são todas nulas, a, = O sei < j. 
Considere uma parcela t do determinante de A. 


t = (sgn o)ar az, ea onde — o=ii i, 


ni,’ 


Suponha que i; # 1. Então 1 < į e, portanto, di, = 0. Logo, t = 0. Ou seja, é nulo cada termo em que i, £ 1. 
Agora suponha que i; = 1, mas i, Æ 2. Então 2 < i, e, portanto, az;, = 0. Logo, t = 0. Ou seja, é nulo cada 
termo em que i; £ lou i £2. 
Analogamente, é nulo cada termo em que i} Æ 1 ou i Æ 2 ou ... ou i, Æ n. Por isso, |A| = 411422 `` © apn = 
produto dos elementos diagonais. 


Demonstre o Teorema 8.3. B é obtida a partir de A por uma operação elementar. 
G) Se duas linhas (colunas) trocaram de posição, então |B| = — |A]. 
(ii) Se uma linha (coluna) de A foi multiplicada por um escalar k, então |B| = kJ4]. 


(iii) Se um múltiplo de uma linha (coluna) de A foi somado a uma outra linha (coluna) de 4, então |B| = |4). 
(i) Esse resultado está provado no Problema 8.23. 
(ii) Se aj-ésima linha de A for multiplicada por k, então cada parcela de |A] será multiplicada por k, portanto, |B| = kļA|. 


Ou seja, 


|B| = 55 (sgn Jar; Mi, a (ha) “Qi, — k >, (sgn 0a; Mi, “Gi, Z kļ|A| 
O 


o 
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(iii) Suponha que à j-ésima linha de A somamos c vezes a k-ésima linha de A. Usando o símbolo chapéu ^ para denotar 
a j-ésima posição numa parcela do determinante, temos 


|B| = > (sgn o)aj; azi, °> (Capi, + aj) “Oni 


[o] 


=c} (sgn 0a, di Ai “Qui, + > (sgn 0a, di," A" Ani, 
[ol o 


n 


A primeira soma é o determinante de uma matriz cujas k-ésima e j-ésima linhas são iguais. Assim, pelo Teo- 
rema 8.2(ii), essa soma é nula. A segunda soma é o determinante de A. Logo, |B| = c -0 + |A| = |A]. 


EA| = |EIJA]. 


Considere as operações elementares com as linhas: (i) multiplicar uma linha por uma constante k Æ 0, (ii) trocar duas 
linhas entre si, (iii) somar um múltiplo de uma linha a uma outra linha. 


Demonstre o Lema 8.6. Seja E uma matriz elementar. Então, 


Sejam E,, E,, E, as matrizes elementares correspondentes. Ou seja, E,, E,, E, são obtidas aplicando as operações dadas 
à matriz identidade 7. Pelo Problema 8.25, 


[Ei = KM] = k, E) = -| = =1, lE; =|= 1 


Sabemos (Teorema 3.11) que EA é a matriz obtida aplicando a operação correspondente a A. Assim, pelo Teorema 8.3, 
obtemos as afirmações do lema, como segue. 


IEA] = k|A| = |E; |A], IEA) = -|A| = |E2||4l, |E;A| = |A| = 14] = |Es||4] 


Seja B uma matriz equivalente por linhas a uma matriz quadrada A. Prove que |B| = O se, e só se, |A| = 0. 


Pelo Teorema 8.3, o efeito de uma operação elementar é trocar o sinal do determinante ou multiplicar o determinante 
por um escalar não nulo. Assim, |B| = O se, e só se, |A| = 0. 


Demonstre o Teorema 8.5. Seja A uma matriz quadrada. São equivalentes as afirmações dadas. 
(1) A é invertível, (ii) AX = 0 possui apenas a solução nula, (iii) det(A) #0. 


A demonstração utiliza eliminação gaussiana. Se A for invertível, então A é equivalente por linhas a Z. Como |Z| £ 0, o 
Problema 8.27 garante que |4| £ 0. Se A não é invertível, então A é equivalente por linhas a uma matriz com uma linha 
nula. Logo, det(A) = 0. Assim, (i) é equivalente a (iii). 

Se AX = 0 tem somente a solução nula X = 0, então A é equivalente por linhas a 7 e A é invertível. Reciprocamente, se 
A é invertível, com inversa 471 então 


X = IX = (AA)X = A! (4X) = 4710 = 0 


é a única solução de AX = 0. Assim, (i) é equivalente a (ii). 


Demonstre o Teorema 8.4. |AB| = |AI|B|. 


Se A é não singular, então AB também é não singular e, portanto, |AB| = O = |A]|B]. Por outro lado, se A é não singular, 
então 4 = E, +: EE, é um produto de matrizes elementares. Logo, pelo Lema 8.6 e indução, obtemos 


|4B]| = |E, -:-E,E,B] = |E] + + 1Eo]|E,|B| = |A|] 


Seja P invertível. Prove que |P7!| = |P|”'. 
=1 =] =] -1 = 
P'P=ILogo,l=||=|P“P|=|P"'I|P|,e, portanto, |P | = |P). 
Demonstre o Teorema 8.7. Se A e B são matrizes semelhantes, então |4| = |B|. 


Se 4 e B são semelhantes, existe uma matriz invertível P tal que B = PAP. Logo, usando o Problema 8.30, obtemos 
— |p- — p= Z -LIP — 

|B| = |P- AP] = |P} ||A||P| = [AP |P = JA]. 

Observamos que, embora as matrizes P7! e A possam não comutar, seus determinantes p= |e |4] comutam, por serem 

escalares do corpo K. 


Demonstre o Teorema 8.8 (Laplace). Sejam A = [a;] e A, o cofator de a,. Então, para quaisquer i ou j, 


|A| = apn +" + amni e |A| = ajA + + aAy 
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T] e . . . b 
Como |A| = |A |, basta provar uma dessas expansões, digamos, a primeira, em termos das linhas de A. Cada parcela de 
|A| contém uma, e só uma, entrada da i-ésima linha (a,,, à, . ., &in) de A. Logo, podemos escrever |A| na forma 


M| = anA + ap4b ++ ans 


* o. x > gas : : Z 
(Observe que A% é uma soma de parcelas que não tem elemento algum da i-ésima linha de A.) Assim, o teorema estará 
provado se conseguirmos mostrar que 


k — /_1\Hi 

Ağ = A; = (1) "|M; 

onde M, é a matriz obtida suprimindo a linha e a coluna que contêm a entrada a,. (Historicamente, a expressão A ; era 

denominada cofator de a, e, portanto, o teorema reduz a mostrar que as duas definições de cofator são equivalentes. ) 
Primeiro consideramos o caso em que i = n, j = n. Então a soma das parcelas de |A| contendo a, é 


nn 


an nAñn = > (sgn 0)a15(1)I20(2) “An o(n-1) 


onde somamos sobre todas as permutações o € S, para as quais o(n) = n. Contudo, isso é equivalente (mostre isso!) a 


somar sobre todas as permutações de (1,...,n — 1). Assim, 4%, = IM,,| = (1) IM, | 


Agora, consideramos i e j arbitrários. Trocamos a i-ésima linha com c linha que a sucede até ela ser a última e, em 

seguida, trocamos a j-ésima coluna com cada coluna que a sucede até ela ser a última. Observe que o determinante |M il 

não se altera, porque as posições relativas das outras linhas e colunas não são afetadas por essas trocas. Contudo, o 
“sinal” de |A| e de A% foi trocado n — i vezes e, depois, outras n — j vezes. Em vista disso, 


A% = (PPM; = (-)M, 


Seja A = [a;] e seja B a matriz obtida de A substituindo a i-ésima linha de A pelo vetor coluna (paes da) 
Mostre que 


|B| = ba4jn + bpAp +: + DbinAin 
Além disso, mostre que, para j Æ i, 
anAa tado +: +aÃp=0 e GA + ajA +: H apjAni = 0 


Seja B = [b,). Pelo Teorema 8.8, 


|B| = baB boBp Eee binBin 


Como B, não depende da i-ésima linha de B, obtemos B, = A, para j = 1, ..., n. Logo, 


|B| = baAn + bnAi +" + binin 
Seja, agora, A’ a matriz obtida a partir de A substituindo a i-ésima linha de A pela j-ésima linha de A. Como A’ tem duas 
linhas iguais, |4'| = 0. Assim, pelo resultado que acabamos de ver, obtemos 
|4'! = aÃ +HapÃp++anAn=0 
Usando que |A| = |4', também obtemos a,;A1; + a2;43; ++ + apjAni = 0. 


Demonstre o Teorema 8.9. A(adj 4) = (adj AJA = |AlI. 
Sejam A = [a;] e A(adj A) = [b,). A i-ésima linha de A é 


(an, an,- --,ain) (1) 


Como adj A é a transposta da matriz de cofatores, a j-ésima coluna de adj A é a transposta dos cofatores da j-ésima linha 
de 4, como segue. 


T 
(Aj, Azs- -3Ajn) 2) 


Agora, a ij-ésima entrada b, de A(adj A) é obtida multiplicando as expressões (1) e (2), como segue. 


bj = apá +apÃp ++ anÁ; 


int jn 
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Pelo Teorema 8.8 e o Problema 8.33, 


Por isso, A(adj A) é a matriz diagonal com elementos diagonais iguais a |A|. Em outras palavras, A (adj 4) = |A]I. Ana- 
logamente, (adj AJA = |A WZ. 


Demonstre o Teorema 8.10 (Regra de Cramer). O sistema (quadrado) AX = B possui uma única solução se, 


e só se, D 0. Nesse caso, x, = N/D, para cada i. 


Já vimos que AX = B possui uma única solução se, e só se, A é invertível e que A é invertível se, e só se, D = |A| # 0. 
Suponha, agora, que D Æ 0. Pelo Teorema 8.9, 47! = (1/D)(adj 4). multiplicando AX = B por 47! obtemos 


X =4 4X = (1/D)(adj 4)B (1) 


Observe que a i-ésima linha de (1/D)(adj 4) é (1/D)(Ay;, Ap; --. + Ani). Se B = (b1, b2,- .. , bp)”, então, por (1), 
temos 


x; = (1/D)(biAy; + bz4zi ++: + Da Ani) 


No entanto, como no Problema 8.33, temos b441; + b242; + ++ + b,A,i; = N; que é o determinante da matriz obtida 
substituindo a i-ésima coluna de A pelo vetor coluna B. Assim, x, = (1/D)N,, como queríamos mostrar. 


Demonstre o Teorema 8.12. Seja M uma matriz triangular superior (inferior) em blocos com blocos diago- 
nais 4,, A,,..., A,. Então 


det(M) = det(A,) det(4,) --- det(4,) 


A C 


0 B | . A demonstra- 


Basta provar o teorema para n = 2, ou seja, quando M é uma matriz quadrada da forma M = | 


ção no caso geral segue facilmente, por indução. 
Sejam A = [a,] uma matriz quadrada de ordem r, B = [b,] uma matriz quadrada de ordem s e M = [m,] uma matriz 
quadrada de ordem n, com n = r + s. Por definição, 


det(M) = 3 (sgn o)mio(1)Mz0(2) `` Mno(n) 


OES, 
Sei>re j< r, então m; = 0. Assim, basta considerar aquelas permutações O tais que 
a{r+1,r+2,... r +s} ={r+1,r+2,...,r +s} e Efl 2r {12r} 
Seja o; (k) = a(k) para k < r,e seja o2(k) = o(r + k) — r para k < s. Então 
(sgn 0)m(1)M2o(2) *** Mno(n) = (SEN 01)410,(1)420,(2) `` ° Aro, (r) (SEN 02)b10,(1)b20,(2) ° ° Bsoz(8) 


que implica det(M) = det(A) det(B). 


Demonstre o Teorema 8.14. Existe uma única função D : M > K tal que 
(1) D é multilinear, (ii) D é alternada, (iii) D(D = 1. 
Essa função D é a função determinante, ou seja, D(A) = |A]. 
Seja D a função determinante D(A) = |A|. Devemos mostrar que D satisfaz (i), (ii) e (iii) e que D é única função que 
satisfaz (1), (ii) e (iii). 
Pelo Teorema 8.2, D satisfaz (ii) e (iii). Mostremos que é multilinear. Suponha que a i-ésima linha de A = la, seja da 
forma (b; + Ca, bp + cp, -.., bin + Ci). Então 
D(A) = D(A,, ..., Bi+ Cir ..., An) 


= 3 (sgn 0)ars(1) Rus A ro(i-1)(Dio(i) + Cio(i)) t Ano(n) 


=>, (sgn o)dio(1) s Dio(i) “t Quo(n) F > (sgn o)dio(1) “= Cio(i) ` ` Ano(n) 


n n 


moista) DIA per Cresta) 
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Também, pelo Teorema 8.3(ii), 
D(A,,..,kA,. --, 4n) =KD(A,,...,A;,.. 0,44) 


Assim, D é multilinear, ou seja, D satisfaz (i). 


Demonstremos, agora, a unicidade de D. Seja D uma aplicação que satisfaz (i), (ii) e (iii). Se {e}, ..., e,) é a base canô- 
nica de K”, então, por (iii), D(e,,e5,...,e,) = D(1) = 1. Usando (ii), também temos 
D(e;,€;»---»6,) = S80 0, onde o=ib ei, (1) 


Seja, agora, A = [a,]. Observe que a k-ésima linha A, de A é 


Ar = (aki, p25- + +, An) = Aly F Ap +: + Amen 
Assim, 
D(A) = D(a;e; ei + ainen 1,1 pise + anen» “+, Ane pese + annen) 


Usando a multilinearidade de D, podemos escrever D(A) como uma soma de parcelas do tipo 


D(A) = » D(a; eis Ai, €i,, a anien) 
= > (aii a, “ai, )D(e;, vegas jê) (2) 
onde a soma percorre todas as sequências i;i, .. . ip, com ip € (1,...,n). Se dois dos índices forem iguais, digamos, 
i; = ip com j £ k, então, por (ii), 
D(e; 6 , p) =0 


Dessa forma, a soma de (2) só precisa ser somada sobre todas as permutações o = i;i, :- - i,. Usando (1), finalmente 
obtemos que 


D(A) = 5, (aii doi Ani, )D(e;, potes ei) 
[o] 
= E» (sgn 0)ari, dai, “Oni, onde o=ii i, 
(o 
Assim, D é a função determinante e o teorema está provado. 
Problemas Complementares 
Cálculo de determinantes 
8.38 Calcule 
2 6 5 1 =2 8 4 9 a+b 
DF i œl E o [5 E ol EE ip e 
. t—4 Fola t—1 4 j 
8.39 Encontre todos os t tais que (a) | 2 1—9 | =0, (b) | 3 fe | 0 
8.40 Calcule o determinante de cada uma das matrizes seguintes. 
2 1 1 3 —2 —4 —2 -l 4 7 6 5 
(a) |0 5 21, (b) |2 5 OI (e)p 6 3 2 ()|l 21 
1 —3 4 0 6 1 4 1 2 3 2 1 
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8.41 Encontre o determinante de cada uma das matrizes seguintes. 


1 2 2 3 2 1 3 2 
1 0 -2 0 3 0 | =2 
Ba e a N 4 
4 -3 0 2 2 2 -l1 1l 
8.42 Calcule 
2 =] 3 —4 2 -1 4 -3 l =2 3 — 
2 1 -2 1 —1 1 0 2 1 1 -2 0 
Bs gcs ar as z ga o q 4 os 
5 2 -l1 4 | =2>2 =3 1 4 4 —6 
8.43 Calcule cada um dos determinantes seguintes. 
1 2 -l1 3 1 13 5S7 9 12345 
2a +] 1 —2 3 24242 54321 
(a) 3 1 0 2 =l ©) 0 0. 1 2 3 (€) |0 065 1 
5 1 2 —3 4 0 0 5 62 00074 
=2 3 =] 1 -2 0 0 2 3 1 0002 3 


Cofatores, adjuntas clássicas, inversas 


8.44 Encontre det(A), adj A e 47! com 
1 1 0 I Z 2 
(a) 4=|1 1 1|, œ 4=/3 1 0 
021 1 1 1 


8.45 Encontre a adjunta clássica de cada matriz do Problema 8.41. 


b 


: a 
8.46 Seja 4 = k d 


| .(a) Encontre adj A, (b) Mostre que adj(adj A) = A, (c) Quando temos A = adj A? 


8.47 Mostre que, se A é diagonal (triangular), então adj A é diagonal (triangular). 


8.48 Seja A = [a,] uma matriz triangular. Mostre que 
(a) A é invertível se, e só se, cada entrada diagonal a; + 0. 


(b) Os elementos diagonais de 47! (caso exista) são os recíprocos a;; ! dos elementos diagonais de 4. 


Menores, menores principais 


1 2 3 2 1 3 =l 5 
8.49 Sejam 4 = : E -7 eB = E > : . Encontre o menor e o menor com sinal correspon- 
4 -3 0 — 3 0 I S2 


dente às submatrizes dadas. 


(a) A(1, 4; 3,4), (b) B(1, 4; 3,4), (c)A(2,3; 2,4), (d) B(2,3; 2,4). 
8.50 Para k = 1, 2, 3, encontre a soma S, de todos os menores principais de ordem k, com 
1 3 -2 1 5 —4 1 —4 3 


() 4=|2 -4 3|, © B=|2 6 1|, © C=|2 ı 5 
5 do 1 z az q 4 -7 1l 
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8.51 Para k = 1, 2, 3, 4, encontre a soma S, de todos os menores principais de ordem k, com 


(a) 4= b) B= 


pomm 

— 

N 

N 
Nom 
Uwe N 
BON mm 
EUR 


Determinantes e sistemas de equações lineares 


8.52 Resolva os sistemas dados com determinantes. 


3x+5y=8 2x —-3y=—1 ax — 2by = c 
(a) Paa (b) Ta (c) En (ab #0) 


8.53 Resolva os sistemas dados com determinantes. 


2x —5Sy+22=2 2 +3=y+3x 
(a) x+2y—42=5, (b) x—-32z=2y+1 
3x — 4y — 62=1 3y +z=2-—2x 


8.54 Demonstre o Teorema 8.11. Um sistema AX = 0 tem alguma solução não nula se, e só se, D = |A| = 0. 


Permutações 


8.55 Encontre as paridades das permutações o = 32154, t = 13524, n = 42531 de S.. 
8.56 Para as permutações do Problema 8.55, encontre 


(a) too, (b) nec, (0) ot, (d) Tr. 
8.57 Sejat € S,. Mostre que t ° o percorre S$, quando o percorre S,,ouseja,S, = (TO 0: 0 E Sp}. 
8.58 Sejao € S, tal que o(n) = n.Sejao* € S,. , definida por 0*(x) = o(x). 

(a) Mostre que o* = sgn 0, 


(b) Mostre que, quando ø percorre S, mantendo o(n) = n, o* percorre S„_;; ou seja, 


nº 


Sm = {0* : o € S, a(n) =n}. 


8.59 Considere uma permutação o = jı jz - --jJn. Sejam (e,) a base canônica de K” e A a matriz cuja i-ésima linha é 
e; [ou seja, 4 = (e; AEN ve). Mostre que |A| = sgn o. 


1º Cio? 


Determinante de operador linear 


8.60 Encontre o determinante de cada uma das transformações lineares seguintes. 
(a) T:R? — R? definida por T(x,y) = (2x — 9y, 3x — 5y), 
(b) T:R? — R? definida por T (x,y,z) = (3x — 2z, 5y +7z, x+y+2), 
(c) T:R? — Rº definida por T (x,y,z) = (2x + 7y — 4z, 4x — 6y + 2z). 


8.61 Seja D:V — V o operador derivada, ou seja, D(f(t)) = df/dt. Encontre det(D) sendo V o espaço vetorial de funções com 
a base dada. (a) (1,t,...,Ê), (b) {¢, e”, EN, (c) {sen t, cos t}. 


8.62 Demonstre o Teorema 8.13. Sejam F e G operadores lineares de um espaço vetorial V. Então 
G) det(F o G) = det(F) det(G), (ii) F é invertível se, e só se, det(F) 0. 


8.63 Demonstre (a) det(1,) = 1, sendo 1, o operador identidade, (b) det (T7!) = det (T a se T” for invertível. 


Æ] ÁLGEBRA LINEAR 


Problemas variados 


8.64 


8.65 


8.66 


8.67 


8.68 


8.69 


8.70 


8.71 


8.72 


8.73 


Encontre o volume V(S) do paralelepípedo S de Rº determinado pelos vetores dados. 
(a) u = (1,2,-3),u, = (3,4,-1), us = (2,-1,5), 

(b) ui = (1, 1,3), u = (1, =2, —4), uz = (4, i 5). 

Encontre o volume V(S) do paralelepípedo S de Rf determinado pelos vetores dados. 


u = (1,-2,5,—1), uy = (2, 1,—2, 1); uz = (3,0, l —2), us, = (1,-1,4,—1) 


b 
Seja V o espaço vetorial das matrizes M = K à] de ordem 2 sobre R. Decida se a aplicação D:V — R dada é bili- 


near (em relação às linhas). 


(a) D(M) = a + d, (c) D(M) = ac — bd, (e) D(M) = 0, 
(b) D(M) = ad, (d) D(M) = ab — cd, (f) D(M) = 1. 


Seja A uma matriz quadrada de ordem n. Mostre que |kA| = k”|4]. 


Sejam A, B, C, D matrizes quadradas de ordem n que comutam. Considere a matriz quadrada de ordem 2n em blocos 
M = [é a . Prove que|M| = |A||D| — |B||C|. Mostre que a afirmação pode ser falsa se as matrizes não comutarem. 
Seja A uma matriz ortogonal, isto é, AA = I. Mostre que det(4) = +1. 


Seja V o espaço das matrizes quadradas de ordem m vistas como m-uplas de vetores linha. Seja D:V — K uma aplica- 
ção m-linear alternada. Mostre que 


(a) D(...,4,...,B,...) = —D(...,B,...,4,..-); isto é, o sinal muda se trocarmos a posição de duas linhas; 


(b) se A, As, ..., A, são linearmente independentes, então D(A,,45,...,Am) = 0. 


Sejam V o espaço das matrizes quadradas de ordem m (como no Problema 8.70) e D: V — K. Mostre que a afirmação 
seguinte é equivalente a D ser alternada. 


D(A,,43,..,4,))=0 sempre que A; = A; para algum i. 


Seja V o espaço das matrizes quadradas de ordem n sobre K. Seja B € V invertível, de modo que det(B) 4 0. Defina 
D:V — K por D(A) = det(AB)/det(B), com 4 € F. Logo, 


D(A,,43,...,4n) = det(A,B,A,B, ..., A,B)/det(B) 


em que 4, é a i-ésima linha de A e, portanto, A,B é a i-ésima linha de AB. Mostre que D é multilinear alternada e que 
D(1 = 1. (Alguns textos usam esse método para provar que |AB| = |AI|B].) 


Mostre que g = g(x4,...,X,) = (—1)"V, (x), onde g = g(x) é o produto das diferenças do Problema 8.19, x = x, e 
V,-1é o determinante de Vandermonde definido por 
1 1 1 1 
Xi Xz Xn-1 xX 
Wasza E 
E g e a 


Seja A uma matriz qualquer. Mostre que o sinal de um menor A[I, J] é igual ao de seu menor complementar A[7',J'. 
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8.74 Seja A uma matriz quadrada de ordem n. O posto determinante de A é a ordem da maior submatriz quadrada de A (ob- 
tida suprimindo linhas e colunas de A) cujo determinante é não nulo. Mostre que o posto determinante de A é igual ao 
posto de A, que é o maior número de linhas (ou colunas) linearmente independentes de A. 


Respostas dos Problemas Complementares 


Notação: M = |R; Rs; -...] denota uma matriz de linhas R,, R,, ... 

838 () —22, 6-3 (46 D-, (e) drad+P 
8.39 (a) 3,10; (b) 5,02 

840 (a) 21, œŒ) -Il, (© 100, (dO 

8.41 (a) —131, (b) —55 

842 (a) 33, (Db 0 (o 45 


8.43 (a) —32, (b) -I4, (o) -468 


844 (Dl4/=-2, adj4=[-1,-1,1; -1,1,-1; 2,-2,0), 
(bD)l4l=-1, adi4=[1,0,-2; -3,-1,6; 2,1,-5]. Também, A~! = (adj 4)/ļA| 


8.45 (a) [-16,-29,-26,-2; 30, -38, —16, 29; 8,51,-13,-1; 13, 1,28, 18], 
(b) [21,-14,-17,-19; 44,11,33,11; —29,1,13,21; 17,7, —19, —18] 


8.46 (a) adj4=[d,-b; -ca), (O) 4=H 
8.49 (a) -3,-3, (b) -23,-23, (o) 3-3, (d) 17,-17 
8.50 (a) -2,-17,73, (b) 7,10,105, (e) 13,54,0 


8.51 (a) -6,13,62,-219; (b) 7,-37,30,20 


win 


8.52 (a) x= y= (b) ==; (c) x=- y=- 
8.53 (a) x = 5,y = 2,z = 1, (b) Como D = 0, o sistema não pode ser resolvido com determinantes. 


8.55 (a) sgn ø= 1l,sgn t = —1,sgn 7z = —1 


8.56 (a) t00=53142, (b) moo=5243, (o) o! =32154, (d) q! = 14253 
8.60 (a) det(T) = 17, (b) det(T) = 4, (c) Não está definido. 

8.61 (a) 0, (b) 6, (c) 1 

8.64 (a) 18, (b) O 

8.65 17 


8.66 (a) Não é, (b) É, (c) É, (d) Não é, (e) É, (f) Não é. 


Capítulo 9 


Diagonalização: 
Autovalores e Autovetores 


9.1 INTRODUÇÃO 


As ideias apresentadas neste capítulo podem ser discutidas em dois contextos. 


Contexto de matrizes 


Seja dada uma matriz quadrada A de ordem n. Dizemos que a matriz A é diagonalizável se existir uma matriz não 
singular P tal que 


B=P !AP 


seja diagonal. Neste capítulo estudamos a diagonalização de uma matriz A. Em particular, fornecemos um algorit- 
mo para encontrar a matriz P, quando existir. 


Contexto de operadores lineares 


Seja dado um operador linear T: V — V. Dizemos que o operador T é diagonalizável se existir uma base S de V tal 
que a representação matricial D de T em relação à base S for uma matriz diagonal. Neste capítulo estudamos con- 
dições sob as quais o operador T é diagonalizável. 


Equivalência dos dois contextos 


Os dois conceitos apresentados são, essencialmente, o mesmo. Mais precisamente, uma matriz quadrada A pode ser 
vista como o operador linear F definido por 


F(X) = AX 


onde X é um vetor coluna e B = P-!AP representa F em relação a um novo sistema de coordenadas (base) S cujos 
elementos são as colunas de P. Por outro lado, qualquer operador linear T pode ser representado por uma matriz A 
em relação a alguma base e, escolhendo alguma outra base, T é representado pela matriz 


B = P'AP 


em que P é a matriz de mudança de base. 
A maioria dos teoremas será enunciada de duas formas, uma em termos de matrizes A e outra em termos de 
operadores lineares T. 
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Papel do corpo K 


O corpo K subjacente não teve, até agora, papel especial algum nas nossas discussões sobre espaços vetoriais e 
transformações lineares. No entanto, a diagonalização de uma matriz A ou de um operador linear T depende das 
raízes de um polinômio A(t) sobre K e essas raízes dependem de K. Por exemplo, suponha que A(t) = P+I. 
Então A(t) não tem raízes se K = R, o corpo dos reais, mas A(t) tem as raízes +i se K = C, o corpo dos comple- 
xos. Além disso, encontrar as raízes de um polinômio de grau maior do que dois é, em geral, um assunto em si 
(frequentemente discutido em disciplinas de Cálculo Numérico). Por isso, nossos exemplos geralmente levam a 
polinômios A(f) cujas raízes são encontradas facilmente. 


9.2 POLINÔMIOS DE MATRIZES 


Considere um polinômio f (t) = a,t” + --- + aıt + ag sobre um corpo K. Na Seção 2.8 definimos, para matrizes 
quadradas A quaisquer, 


f(A) = a,Á”" +--+ aA + agl 
onde 7 é a matriz identidade. Em particular, dizemos que A é uma raiz de f(t) se (A) = 0, a matriz nula. 


== 1 2 ps iii 7 10 i 
Exemplo 9.1 Seja4= |} 4| Então 4 = |15 22 l Sejam 
f =2P-3t+5 e s()=2-5t-2 


Então 


=. [14 20] [-3 -6] [5 0] [16 14 
JA) =24 4 +51= [39 44 eg sd) | 6] [at 


e or O mn —5 —10 —2 0) JO 0 
PA ssl E wT O a oet 
Assim, A é um zero de g(t). 


Vale o teorema seguinte (demonstrado no Problema 9.7). 


Teorema 9.1 Sejam fe g polinômios. Dados qualquer matriz quadrada A e qualquer escalar k temos 
© (S+) =U) +4) D (WA) = (A) 
Gi) (4) = HA)g(4) Gv) HAg(4) = g(A) S (4). 


Observe que (iv) nos diz que dois polinômios quaisquer de A comutam. 


Matrizes e operadores lineares 


Seja, agora, T: V — V um operador linear de um espaço vetorial V. As potências de T podem ser definidas pela 
composição, como segue. 


T=ToT, TP =ToT, 


Também, dado qualquer polinômio f (t) = a,t” + --- + aıt + ag, definimos f(T) da mesma forma que para matri- 
zes, ou seja, 


f(T) =a, T" +- +aT + al 


onde, agora, I é o operador identidade. Também dizemos que T é uma raiz de f(t) se AT) = 0, o operador nulo. 
Observamos que as relações do Teorema 9.1 são válidas tanto para operadores lineares quanto para matrizes. 


OBSERVAÇÃO Seja A uma representação matricial de um operador linear T. Então f(A) é a representação matri- 
cial de f(T) e, em particular, f(T) = O se, e só se, A) = 0. 


E ÁLGEBRA LINEAR 


9.3 POLINÔMIO CARACTERÍSTICO, TEOREMA DE CAYLEY-HAMILTON 


Seja A = [a,] uma matriz quadrada de ordem n. A matriz M = A — tl, em que 1, é a matriz quadrada identidade de 


ordem n e t é uma incógnita, pode ser obtida subtraindo t de cada elemento diagonal de A. A matriz simétrica na 
soma de M é a matriz t1, — A e seu determinante 


A(t) = det(t, — A) = (—1)" det(A — tI,) 


que é um polinômio de grau n em ż, é denominado polinômio característico de A. 
Enunciamos, agora, um teorema importante da Algebra Linear (demonstrado no Problema 9.8). 


Teorema 9.2 (Cayley-Hamilton) Cada matriz A é uma raiz de seu polinômio característico. 


OBSERVAÇÃO SeA4 = [a] for uma matriz triangular, então 1] — A é uma matriz triangular com entradas diago- 
nais t — a, e, portanto, 


A(t) = det(tI — A) = (t — a11 )(t — az) >: (t — ann) 


Observe que as raízes de A(t) são as entradas diagonais de A. 


Exemplo 9.2 O polinômio característico de 4 = p l é 


t= 1 =3 


A(t) = |4 — A| = G ad 


|= e- D¢-59-12=2 -6-7 


Conforme afirma o Teorema de Cayley-Hamilton, A é uma raiz de A(t), pois 


dio bao esco E 5 = =i] [5 ojo 
E a =| sla o+ 0 E | 


Sejam, agora, A e B são matrizes semelhantes, digamos, B = P-!AP, em que P é invertível. Mostremos que A 
e B têm o mesmo polinômio característico. Usando tl = P-!HP, temos 


Ap(t) = det(t — B) = det(t — P-!AP) = det(P lHP — PAP) 
= det[P!(t — AJP] = det(P”!) det(tI — 4) det(P) 
Como os determinantes são escalares, decorre que comutam e, como det(P-!) det(P) = 1, obtemos 
Ap(t) = det(t — 4) = A(t) 
Assim, demonstramos o teorema a seguir. 


Teorema 9.3 Matrizes semelhantes têm o mesmo polinômio característico. 


Polinômios característicos de graus 2 e 3 


Há fórmulas simples para os polinômios característicos de matrizes de ordens 2 e 3. 


(a) Seja 4 = k a Então 
do An 


A(t) = Ê — (aj; +a )t + det(4) = Ê — tr(4) t + det(4) 


Aqui, tr(A) denota o traço de A, isto é, a soma dos elementos diagonais de A. 
ai) do dis 

(b) Seja A= |a à» as | Então 
a31 d3 033 
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A(t) =? = tr(4) Ê + (41 + A + 433)t = det(A) 


Aqui, A,,, A», Ass denotam, respectivamente, os cofatores de a,,, 43, Aya. 


Exemplo 9.3 Encontre o polinômio característico de cada uma das matrizes seguintes. 


oasi gho s o e-f 3) 
(a) Temostr(4) =5+10=15 e |A| = 50 — 6 = 44, portanto, A(t) +? — 15t + 44. 
(b) Temos tr(B)=7+2=9 e |B| = 14+ 6 = 20, portanto, A(t) = ê — 9t + 20. 
(c) Temostr(C)=5-4=1 e |C|= -20 +8 = —12, portanto, A(t) =? — t — 12. 


1 1 2 
Exemplo 9.4 Encontre o polinômio característico de 4 = |0 3 2|, 
139 


Temos tr(A) = 1 + 3 + 9 = 13. Os cofatores dos elementos diagonais são 


32 
3 9 


11 


4u =] 0 3 


EE 


1 9 = 7, 4a =| 


á 


Assim, 44 + 43, +433 = 31e, também, |A| = 27 + 2 + 0 — 6 — 6 — 0 = 17, Dessa forma, 
A(t) = Ë -13 +31- 17 


OBSERVAÇÃO Os coeficientes do polinômio característico A(t) de uma matriz quadrada de ordem 3 são os se- 
guintes, com sinais alternados. 


Si = tr(A), So = Aii + As + 433, S3 = det(A) 


Observamos que cada S, é a soma de todos os menores principais de A de ordem k. 


O próximo teorema, cuja demonstração está além do alcance deste livro, nos diz que esse resultado é verdadei- 
ro em geral. 


Teorema 9.4 Seja A uma matriz quadrada de ordem n. O polinômio característico de A é 
Att ES pesei Ds, 


onde S, é a soma de todos os menores principais de ordem k. 


Polinômio característico de um operador linear 


Seja, agora, T: V — V um operador linear de um espaço vetorial V de dimensão finita. Definimos o polinômio ca- 
racterístico A(t) de T como sendo o polinômio característico de qualquer representação matricial de T. Lembre-se 
que se A e B forem representações matriciais de T, então B = P-!AP, sendo P a matriz de mudança de base. Assim, 
Ae B são semelhantes e, pelo Teorema 9.3, A e B têm o mesmo polinômio característico. Por isso, o polinômio ca- 
racterístico de T independe da particular escolha da base na qual calculamos a representação matricial de T. 

Como fT) = 0 se, e só se, (A) = 0, sendo f(t) um polinômio qualquer e A uma representação matricial qual- 
quer de T, temos o teorema seguinte análogo para operadores lineares. 


Teorema 9.2” (Cayley-Hamilton) Um operador linear T é uma raiz de seu polinômio característico. 


EZ ÁLGEBRA LINEAR 


9.4 DIAGONALIZAÇÃO, AUTOVALORES E AUTOVETORES 


Seja A uma matriz quadrada de ordem n. Então A pode ser representada por (ou é semelhante a) uma matriz diago- 
nal D = diag(k,, k,, ..., k,) se, e só se, existe uma base S de vetores (coluna) u,, u,, ..., u, tal que 


Au, = kyu 
Au, = hou, 
Au, = kl, 


Neste caso, dizemos que A é diagonalizável. Além disso, se P denotar a matriz não singular cujas colunas são, 
. x -1 
respectivamente, os vetores da base u,, W, ..., u,, então D = P AP. 


nº 


Essa observação nos leva à definição seguinte. 


DEFINIÇÃO Seja A uma matriz quadrada qualquer. Dizemos que um escalar À é um autovalor de A se existe um 
vetor (coluna) não nulo v tal que 


Av = Au 


Qualquer vetor satisfazendo essa relação é denominado autovetor de A associado (ou correspondente, ou perten- 
cente) ao autovalor À. 

Observe que qualquer múltiplo escalar kv de um autovetor v associado a À também é um autovetor associado a 
À, pois 


A(kv) = k(Av) = k(Av) = A(kv) 


O conjunto E; de todos esses autovetores é um subespaço de V (Problema 9.19), denominado autoespaço de 2. (Se 
E, = 1, dizemos que E; é uma reta invariante e À é um fator de escala.) 

Os termos valor característico e vetor característico, ou valor próprio e vetor próprio, também são utilizados 
em vez de autovalor e autovetor. 

Essas observações e definições nos dão o teorema a seguir. 


Teorema 9.5 Uma matriz quadrada A de ordem n é semelhante a uma matriz diagonal D se, e só se, A tem n 
autovetores linearmente independentes. Nesse caso, os elementos diagonais de D são os autovalores associados e 
D = PAP, onde P é a matriz cujas colunas são os autovetores. 


Suponha que uma matriz A possa ser diagonalizada, digamos, P“!AP = D, com D diagonal. Então A possui a 
fatoração diagonal extremamente útil 


A = PDP! 


Usando essa fatoração, a álgebra de A se reduz à álgebra da matriz diagonal D, que é muito facilmente calculada. 
Mais precisamente, digamos que D = diag(k,, k,, ..., k,). Então 


A” = (PDP =PrP*= P diag(k?,... , k”) P' 
Mais geralmente, dado qualquer polinômio f(t), temos 

FA) =f (PDP) = Pf (D)P™ = P diag( f (ki), f (ko), <- -f (Kp )) P7 
Além disso, se os elementos diagonais de D forem não negativos, considere 


B = P diag( Vi, Vin VE) P 


Então B é uma raiz quadrada não negativa de A, ou seja, B? = A e os autovalores de B são não negativos. 
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E lo 9.5 Sejam Á = ~ = ; = Entã 
xemplo 9.5 Sejam 4 = 2 2p% = -2 ev = Lt ntão 


mL ef fg-[-+ 


Assim, v, e v, são autovetores de A associados, respectivamente, aos autovalores 4, = 1 e 4, =4. Observe que 
v, e v, são linearmente independentes e, portanto, formam uma base de R?. Dessa forma, A é diagonalizável. Além 
disso, seja P a matriz cujas colunas são esses autovetores v, € v,, como segue. 


11l 5 =3 
e, portanto, Pp! = |? 3 
21 o 


Então A é semelhante à matriz diagonal 


Hb alla ill 5 


Como era de se esperar, os elementos diagonais 1 e 4 de D são os autovalores associados aos autovetores v, € v, 
respectivamente, que são as colunas de P. Em particular, A tem a fatoração 


aros S 


Por isso, 
=3| [17 85 
i -|170 86 


e-l allo =l 


Além disso, dado f(t) =? — 5? + 3t + 6, temos fl) = 5 e K4) = 2e 


worta JEEE 


Finalmente, calculemos a “raiz quadrada positiva” de A. Para isso, usamos V1 = 1 e v4 = 2 para obter a matriz 


s-e G R-E: 


tal que B? = A, sendo que B tem os autovalores positivos 1 e 2. 
d/|P| —b/|P| 


—=c/|P]  a/|P| 


P= 


pa 


D = P'AP = 


wN w= 


win w= 


wA w= 


OBSERVAÇÃO Em todo este capítulo, usamos o fato seguinte. 
b = 
Se P = [a ento? e 
cd 


Ou seja, para obter P7! trocamos a posição dos elementos diagonais a e d de P, tomamos o simétrico dos elemen- 
tos não diagonais b e c e dividimos cada entrada pelo determinante |P]. 


Propriedades dos autovalores e autovetores 


No Exemplo 9.5 vimos as vantagens de uma representação (fatoração) diagonal de uma matriz quadrada. No teo- 
rema seguinte (demonstrado no Problema 9.20), listamos as propriedades que nos permitem encontrar uma tal re- 
presentação. 


JJ  Árcesra Linear 


Teorema 9.6 Seja A uma matriz quadrada. As afirmações dadas são equivalentes. 


G) O escalar À é um autovalor de A. 
(ii) A matriz M = A — AT é singular. 
(iii) O escalar À é uma raiz do polinômio característico A(t) de A. 
O autoespaço E; de um autovalor À é o espaço solução do sistema homogêneo MX = 0, onde M = A — ÀI, ou 
seja, M é obtida subtraindo À de cada elemento diagonal de A. 
Algumas matrizes não possuem autovalores e, consequentemente, autovetores. No entanto, usando o Teorema 
9.6 e o Teorema Fundamental da Álgebra (todo polinômio sobre o corpo dos complexos C tem alguma raiz), obte- 
mos o resultado seguinte. 


Teorema 9.7 Seja A uma matriz quadrada sobre o corpo dos complexos C. Então A possui pelo menos um auto- 
valor. 


Os teoremas a seguir serão utilizados mais tarde. (O teorema equivalente ao Teorema 9.8 para operadores lineares 
está demonstrado no Problema 9.21 e o Teorema 9.9 está demonstrado no Problema 9.22.) 


Teorema 9.8 Suponha que v,, v, ..., v, sejam autovetores de uma matriz A associados a autovalores distintos 
A, 2,- - - , Ån: Então v,, v, ..., U, são linearmente independentes. 


Teorema 9.9 Suponha que o polinômio característico A(t) de uma matriz quadrada A de ordem n seja um pro- 
duto de n fatores distintos, digamos, A(t) = (t— a,)(t— a>) ---(t — a,). Então A é semelhante à matriz diagonal 
D = diag(a,, a, ...,a,). 


Se À é um autovalor de uma matriz A, então a multiplicidade algébrica de À é definida como a multiplicidade 
de À como raiz do polinômio característico de A e a multiplicidade geométrica de ) é a dimensão do autoespaço, 
dim £E}. Vale o teorema seguinte (cujo equivalente para operadores lineares está demonstrado no Problema 9.23). 


Teorema 9.10 A multiplicidade geométrica de um autovalor À de uma matriz A não é maior do que a multiplici- 
dade algébrica. 


Diagonalização de operadores lineares 


Considere um operador linear T: V — V. Dizemos que T é diagonalizável se T puder ser representado por uma 
matriz diagonal D. Assim, T é diagonalizável se, e só se, existir uma base S = (u,, u,, ..., u,) de V tal que 


Nesse caso, T é representado pela matriz diagonal 
D = diag(k,, k», ...,k,) 


em relação à base S. 
Essa observação nos leva às definições e teoremas seguintes, análogos às definições e teoremas para matrizes 
que já apresentamos. 
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DEFINIÇÃO Seja T um operador linear. Dizemos que um escalar 2 é um autovalor de T se existe um vetor não 
nulo v tal que T (v) = Àu. 

Qualquer vetor satisfazendo essa relação é denominado autovetor de T associado (ou correspondente, ou per- 
tencente) ao autovalor À. 

O conjunto E; de todos os autovetores associados a um autovalor À é um subespaço de V, denominado autoes- 
paço de À. (Alternativamente, À é um autovalor de T se À] — T é singular e, nesse caso, E; é o núcleo de 2] — T.) 
As multiplicidades algébrica e geométrica de um autovalor de um operador T são definidas da mesma maneira 
que as de um autovalor de uma matriz 4. 

Os teoremas seguintes são válidos para operadores lineares T de espaços vetoriais V de dimensão finita. 


Teorema 9.5' T pode ser representado por uma matriz diagonal D se, e só se, existe uma base S de V consistindo 
em autovetores de T. Nesse caso, os elementos diagonais de D são os autovalores associados. 


Teorema 9.6' Seja T um operador linear. As afirmações dadas são equivalentes. 
(1) O escalar À é um autovalor de T. 
(ii) O operador 21 — T é singular. 
(iii) O escalar À é uma raiz do polinômio característico A(t) de T. 


Teorema 9.7 Se V é um espaço vetorial complexo, então T possui pelo menos um autovalor. 


Teorema 9.8' Suponha que v, v, ..., v, sejam autovetores de um operador linear T associados a autovalores dis- 
tintos 41, A2, - - - , Ay: Então v,, v,, ..., v, são linearmente independentes. 


Teorema 9.9 Suponha que o polinômio característico A(t) de T seja um produto de n fatores distintos, digamos, 
A(t) =(t-a)(t—a,)---(t— a,). Então T pode ser representado pela matriz diagonal D = diag(a,, a, ..., a,). 


Teorema 9.10 A multiplicidade geométrica de um autovalor 2 de T não é maior do que a multiplicidade algébrica. 


OBSERVAÇÃO O teorema a seguir reduz a procura de uma diagonalização de um operador linear T à diagonali- 
zação de uma matriz A. 


Teorema 9.11 Seja A uma representação matricial de T. Então T é diagonalizável se, e só se, A é diagonalizável. 


9.5 CÁLCULO DE AUTOVALORES E AUTOVETORES, DIAGONALIZAÇÃO DE MATRIZES 


Nesta seção oferecemos um algoritmo para calcular autovalores e autovetores de uma dada matriz quadrada A dada 
e para decidir se existe ou não uma matriz não singular P tal que P-!AP seja diagonal. 


Algoritmo 9.1 (Algoritmo de Diagonalização) É dada uma matriz quadrada A de ordem n. 


Passo 1 Encontre o polinômio característico A(t) de A. 
Passo 2 Encontre as raízes de A(t) para obter os autovalores de A. 
Passo 3 Repita (a) e (b) para cada autovalor À de A. 


(a) Forme a matriz M = 4 — AI subtraindo À de cada elemento diagonal de A. 
(b) Encontre uma base para o espaço solução do sistema homogêneo MX = 0. (Esses vetores da 
base são autovetores linearmente independentes de A associados a À.) 


ÁLGEBRA LINEAR 


eD 


Passo 4 Considere a coleção S = (v,, v,, .. 


m 


.,v, } de todos os autovetores obtidos no Passo 3. 


(a) Sem +Æ n, então A não é diagonalizável. 
(b) Sem = n, então A é diagonalizável. Mais precisamente, seja P a matriz cujas colunas são os 


v,. Então 


m 


autovetores v,, Vy, .. 


+ý 


D = PAP = diag(24, %,... 


onde 2, é o autovalor associado ao autovetor v,. 


Exemplo 9.6 Aplique o algoritmo de diagonalização à matriz 4 = | 


3) 


3 


(1) Calculamos o polinômio característico A(t) de A. Temos 


t(A)=4-1=03, 
logo, 
A(t) =P —3t— 10 = (t — 5)(t + 2) 


(2) 


(3) 
1 2 


nal de 4 e obtendo a matriz M = E 6 


sistema homogêneo MX = 0, isto é, 


s -ell [o] 


2 
—6 


xX 


I; 


—x+2y=0 
3x — 6y=0 


|A| = —4 — 6 = —10; 


Tomamos A(t) = (t — 5)(t + 2) = 0. As raízes A, =5 e 2, = —2 são os autovalores de A. 
(1) Encontramos um autovetor v, de A associado ao autovalor 2, = 5 subtraindo 2, = 5 de cada elemento diago- 


| Os autovetores associados a À, = 5 formam o espaço solução do 


ou —x+2y=0 


O sistema tem apenas uma variável livre. Assim, uma solução não nula, por exemplo, v, = (2, 1), é um auto- 


vetor que gera o autoespaço de À, = 5. 


(11) Encontramos um autovetor v, de A associado ao autovalor 2, = —2 subtraindo —2 de cada elemento diagonal 
de A (ou, então, somando 2) e obtendo a matriz 
6 2 6x+2y = 0 
M = i ê = 
Ê 1 | e o sistema homogêneo dede qi ou 3x+y=0. 


O sistema só tem uma solução independente. Assim, uma solução não nula, digamos, v, = (—1, 3), é um auto- 


vetor que gera o autoespaço de 2, = —2. 


(4) 


e, portanto, pl = | 


a uiw 


3 


Seja P a matriz cujas colunas são os autovetores v, e v,. Então 


| 


SIN ap 


Dessa forma, D = P-!4P é a matriz diagonal cujas entradas diagonais são os autovalores associados, isto é, 


+ 3 4|f4 2[2 -1 5 0 
D = P` AP = = 
=} 2||3 ali 3 0 -2 
Exemplo 9.7 Considere a matriz B = [1 = : | Temos 
t(B)=5+3=8, |B|=15+1=16; portanto,  A() =P —8t+ 16 = (t — 4) 


Dessa forma, À = 4 é o único autovalor de B. 


CarítuLo 9 e DIAGONALIZAÇÃO: AUTOVALORES E AUTOVETORES —— 309 Q 


Subtraindo 4 = 4 de cada elemento diagonal de B, obtemos a matriz 


1 1]. , a 
“=|; T] | sistema homogêneo =y E ou x-y=0 


O sistema tem uma única solução independente, por exemplo x = 1, y = 1. Assim, v = (1, 1) e seus múltiplos 
são os únicos autovetores de B. Dessa forma, B não é diagonalizável, porque não existe uma base consistindo em 
autovetores de B. 


E i 3 —5 : ; 
Exemplo 9.8 Considere a matriz A = Ê “3 | Aqui, tr(4)=3-3=0 e |A|=-9+10= 1. Assim, 


A(t) = Ë + 1 é o polinômio característico de A. Consideramos os dois casos a seguir. 


(a) Se A é uma matriz sobre o corpo R dos reais, então A(t) não tem raízes (reais). Assim, A não possui autovalo- 
res nem autovalores e, portanto, A não é diagonalizável. 

(b) Se A é uma matriz sobre o corpo C dos complexos, então A(t) = (t — i)(t + i) tem duas raízes, i e —i. Assim, A 
tem os dois autovalores distintos i e —i e, portanto, A possui dois autovetores linearmente independentes. Des- 
sa forma, existe uma matriz não singular P sobre o corpo C dos complexos tal que 


Er i D 
mupe s| 


Assim, A é diagonalizável (sobre ©). 


9.6 DIAGONALIZAÇÃO DE MATRIZES REAIS SIMÉTRICAS E FORMAS QUADRÁTICAS 


Existem muitas matrizes reais que não são diagonalizáveis. De fato, algumas matrizes reais podem sequer possuir 
algum autovalor (real). Contudo, com matrizes reais simétricas, esses problemas não ocorrem. A saber, temos os 
teoremas seguintes. 


Teorema 9.12 Se A é uma matriz real simétrica, então cada raiz À do polinômio característico de A é real. 


Teorema 9.13 Sejam A uma matriz real simétrica e u e v autovetores de A associados a autovalores distintos 
À e À. Então u e v são ortogonais, isto é, (u, v) = 0. 


Esses dois teoremas fornecem o resultado fundamental seguinte. 


Teorema 9.14 Se A é uma matriz real simétrica, então existe uma matriz ortogonal P tal que D = P-!AP é dia- 
gonal. 


A matriz ortogonal P é obtida normalizando uma base de autovetores ortogonais de A, conforme exemplo a 
seguir. Nesse caso, dizemos que A é “ortogonalmente diagonalizável”. 
2 


=2 ; o Ri E 
2 g , uma matriz real simétrica. Encontre uma matriz ortogonal P tal que P714P 


Exemplo 9.9 Seja A = l 


seja diagonal. 
Inicialmente, calculamos o polinômio característico A(t) de A. Temos 


t(4)=2+5=7, |A| =10-4=6; portanto, A(t) = -7t 


ON 
I 
= 
~ 

e 
si 
a 

~ 

n 
st 


Segue que 4, =6 e 2, = 1são os autovalores de A. 


(a) Subtraindo À, = 6 de cada elemento diagonal de A obtemos a matriz 


=a =2 : A —4x— 2y=0 
M = e o sistema homogêneo = 
E E g pr y=0 ou 2x +y 0 


Uma solução não nula é u, = (1, —2). 


Ei  Árcesra Linear 


(b) Subtraindo 2, = 1 de cada elemento diagonal de A obtemos a matriz 


M = | E e o sistema homogêneo x -— 2y = 0 


=2 
(A segunda equação foi eliminada, por ser um múltiplo da primeira equação.) Uma solução não nula é u, = 
(2, 1). 


Conforme afirma o Teorema 9.13, u, e u, são ortogonais. Normalizando u, e u,, obtemos os vetores ortonormais 
û, = (1/v5,-2/V5) e à =(2/05,1/45) 


Finalmente, seja P a matriz cujas colunas são à, e ú,, respectivamente. Então 


= the] e muro 


Como era de se esperar, as entradas diagonais de P-!A4P são os autovalores associados às colunas de P. 


O procedimento desse exemplo pode ser formalizado no algoritmo seguinte, que fornece uma matriz ortogonal 
P tal que P7!AP é diagonal. 


Algoritmo 9.2 (Algoritmo de Diagonalização Ortogonal) É dada uma matriz real simétrica A. 


Passo 1 Encontre o polinômio característico A(t) de A. 

Passo 2 Encontre os autovalores de A, que são as raízes de A(t). 

Passo 3 Para cada autovalor À de A do Passo 2, encontre uma base ortogonal do autoespaço associado. 
Passo 4 Normalize todos autovetores do Passo 3, que formam uma base ortonormal de R”. 


Passo 5 Seja P a matriz cujas colunas são os autovetores normalizados do Passo 4. 


Aplicação às formas quadráticas 


Seja q um polinômio real nas variáveis x,, X», ..., X, tal que cada parcela de q é de grau dois, isto é, 


= 2 
g0 X23- Xn) =D cri + dyxx, com cdj ER 
; 


i<j 


Dizemos, então, que q é uma forma quadrática. Se não existirem parcelas mistas da forma x,x,, isto é, se todos os 
d, forem nulos, dizemos que q é diagonal. l 

Toda forma quadrática q define uma matriz real simétrica A = [a,], com a; = c, e 4jj = aji = zdj. A saber, q 
pode ser escrita no formato matricial 


q(X) = XTAX 


To. “2 . z . . Ra . 
em que X = [x,, x, ..., x,] é o vetor coluna das variáveis. Além disso, seja X = PY uma substituição linear de va- 
riáveis. Substituindo na forma quadrática, obtemos 


q(Y) = (PY) A(PY) = YT(PTAP)Y 


Assim, P'AP é a representação matricial de q nas novas variáveis. 

Procuramos uma matriz ortogonal P tal que a substituição ortogonal X = PY forneça uma forma quadrática 
diagonal, ou seja, para a qual P'AP seja diagonal. Sendo P ortogonal, P? = P-le, portanto, PAP = P-lAP.A 
teoria desenvolvida nesta seção fornece uma tal matriz ortogonal P. 
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Exemplo 9.10 Considere a forma quadrática 


q(x, y) = 2x? — 4xy +5y =XTAX, com E: E e x= [>] 


Pelo Exemplo 9.9, 


P'AP = qa = P'AP, com — 1/45 2/5 
o l EM 1/v5 


Seja Y = fs, SE Então a matriz P corresponde à substituição linear ortogonal X = PY das variáveis x e y em termos 
das variáveis s e t, como segue. 
1 2 2 1 
X= h 


o E E a 


Essa substituição em q(x, y) nos dá a forma quadrática diagonal q(s,t) = 65? + £. 


9.7 POLINÔMIO MÍNIMO 


Seja A uma matriz quadrada qualquer. Seja J(A) o conjunto de todos os polinômios f(t) para os quais A é uma raiz, 
isto é, para os quais (A) = 0. O conjunto J(A) não é vazio em virtude do Teorema 9.2 de Cayley-Hamilton, que nos 
diz que o polinômio característico A,(t) de A pertence a J(A). Seja m(t) o polinômio mônico de menor grau em 
J(A). (Um tal polinômio m(t) existe e é único.) Dizemos que m(t) é o polinômio mínimo da matriz A. 


OBSERVAÇÃO Um polinômio f (t) # O é dito mônico se seu coeficiente dominante (o do termo de maior grau) 
for igual a um. 


Vale o teorema seguinte (demonstrado no Problema 9.33). 


Teorema 9.15 O polinômio mínimo m(t) de uma matriz (operador linear) A divide qualquer polinômio que tenha 
A como raiz. Em particular, m(t) divide o polinômio característico A(t) de A. 


Há até uma relação ainda mais forte entre m(t) e A(t). 


Teorema 9.16 O polinômio característico A(t) e o polinômio mínimo m(t) de uma matriz A têm os mesmos fato- 
res irredutíveis. 


Esse teorema (demonstrado no Problema 9.35) não diz que m(t) = A(t), mas tão somente que qualquer fator 
irredutível de um deles necessariamente divide o outro. Em particular, como um fator linear é irredutível, m(t) e 
A(t) possuem os mesmos fatores lineares. Logo, possuem as mesmas raízes. Assim, temos o teorema a seguir. 


Teorema 9.17 Um escalar À é um autovalor de uma matriz A se, e só se, À é uma raiz do polinômio mínimo m(t) de A. 


2 2 —S5 
Exemplo 9.11 Encontre o polinômio mínimo m(t) de 4 = : 7 —15 | 
1 2 —4 


Primeiro calculamos o polinômio característico A(t) de A. Temos 
tr(4) =55, An tAn +43 =2-3+4+8=7, e 4|=3 


Logo, 


A()=P-5SÊ+n-3=(-1) (4-3) 


EIP ÁLGEBRA Linear 


O polinômio mínimo m(t) deve dividir A(t). Também, cada fator irredutível de A(t) (ou seja, t — 1 et — 3) deve 
ser um fator de m(t). Assim, m(t) é, exatamente, um dos polinômios seguintes. 


2 
HO =0U-3-1) ou g()=(-3(t—1) 
Sabemos, pelo teorema de Cayley-Hamilton, que g(4) = A(A4) = 0. Então, resta testar f(t). Temos 


io =f 2 = 
fA=(A-IDA-3)=|3 6 
12 sa) O -7 


Assim, f(t) = m(t) = (t — D(t—-3) =? — 4t + 3 é o polinômio mínimo de A. 


Exemplo 9.12 


(a) Considere as duas matrizes quadradas de ordem r seguintes, com a 0. 


A 1 0... 0 0 Aa 0... 0 0 
041... 0 0 O) a... 0 0 
RG E A PNR e AS | tia fade 
000... 4 1 000.. å a 
000... 0 4 0 0 0 À 


A primeira matriz, denominada Bloco de Jordan, tem 2’°’s em cada entrada diagonal, 1 em cada entrada superdia- 
gonal (que consiste nas entradas acima da diagonal) e zeros nas demais entradas. A segunda matriz A tem 2ºs em 
cada entrada diagonal, a em cada entrada superdiagonal e zeros nas demais. [Ou seja, A é uma generalização de 
J(A, r).] Mostra-se que 


j 
FO =(1—4) 
é o polinômio característico e também o polinômio mínimo de ambas A e J(A,r). 


(b) Considere um polinômio mônico arbitrário 
Ped a At H att 


Seja C(f) a matriz quadrada de ordem n com 1 em cada entrada subdiagonal (que consiste nas entradas abaixo 
da diagonal), os simétricos dos coeficientes na última coluna e zeros nas demais entradas, como segue. 


0 0... 0 — 0 
LO a Do a 
Ele |O A sa ca 
00... 1 ca 


Dizemos que C(f) é a matriz companheira do polinômio f(t). Mostra-se que o polinômio mínimo m(t) e tam- 
bém o polinômio característico A(t) da matriz companheira C(f) são iguais ao polinômio original (1). 


Polinômio mínimo de um operador linear 


O polinômio mínimo m(t) de um operador linear T é definido como o polinômio mônico de menor grau para o qual 
T seja uma raiz. No entanto, dado qualquer polinômio f(t), temos 


HM =0 seesóse fA)=0 


onde A é uma representação matricial qualquer de T. Dessa forma, T e A têm os mesmos polinômios mínimos. 
Assim, os teoremas relativos a polinômios mínimos de matrizes também se aplicam a polinômios mínimos de ope- 
radores lineares. Ou seja, valem os teoremas seguintes. 


CarítuLo 9 «e DIAGONALIZAÇÃO: AUTOVALORES E AUTOVETORES — ED 


Teorema 9.15 O polinômio mínimo m(t) de um operador linear T divide qualquer polinômio que tenha T como 
raiz. Em particular, m(t) divide o polinômio característico A(t) de T. 


Teorema 9.16' O polinômio característico e o polinômio mínimo de um operador linear T têm os mesmos fatores 
irredutíveis. 


Teorema 9.17 Um escalar À é um autovalor de um operador linear T se, e só se, À é uma raiz do polinômio mí- 
nimo m(t) de T. 


9.8 POLINÔMIOS CARACTERÍSTICO E MÍNIMO DE MATRIZES EM BLOCOS 


Nesta seção discutimos as relações entre certas matrizes (quadradas) em blocos e os polinômios mínimo e caracte- 
rístico. 


Polinômio característico e matrizes triangulares em blocos 
A, 


tI — M também é uma matriz triangular em blocos, com blocos diagonais t/ — A, e tl — A,. Assim, 


Seja M uma matriz triangular em blocos, digamos, M = | | em que 4, e 4, são matrizes quadradas. Então 


t-A -B 


B o tI — A, 


= |H — At — 42l 
Ou seja, o polinômio característico de M é o produto dos polinômios característicos dos blocos diagonais 4, e A,. 


Por indução, obtemos o resultado útil a seguir. 


Teorema 9.18 Seja M uma matriz triangular em blocos com blocos diagonais A,, A,, ..., A, Então o polinômio 
característico de M é o produto dos polinômios característicos dos blocos diagonais A, ou seja, 


Aut) = As (DA (1)... As (t) 


9 -115 7 
Ego) —4 
Exemplo 9.13 Considere a matriz M = H 
0 013 6 
0 0 !—1 8 
a ; PN : . =] 3 6 
Então M é uma matriz triangular em blocos com blocos diagonais 4 = 8 3 B= gt Temos 


tr(4)=9+3=12, det(4)=27+8 = 35e, portanto, As(t) = 2 — 12t +35 = (t — S)(t— 7) 
tr(B)=3+8=11, det(B) =24+6 = 30 e, portanto, Ap(t) = 2 — 11t + 30 = (t — 5)(t — 6) 


Dessa forma, o polinômio característico de M é o produto 
2 
Ay(t) = A4 0)Ag(t) = = 5) (t — 6)(t — 7) 
Polinômio mínimo e matrizes diagonais em blocos 
Vale o teorema seguinte (demonstrado no Problema 9.36). 


Teorema 9.19 Seja M uma matriz diagonal em blocos com blocos diagonais 4,, A,, ..., A,. Então o polinômio 
mínimo de M é igual ao mínimo múltiplo comum (MMC) dos polinômios mínimos dos blocos diagonais A. 


OBSERVAÇÃO  Enfatizamos que esse teorema se aplica a matrizes diagonais em blocos, ao passo que o Teorema 
9.18 análogo para o polinômio característico se aplica a matrizes triangulares em blocos. 
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Exemplo 9.14 Encontre o polinômio característico A(t) e o polinômio mínimo m(t) da matriz diagonal em blocos 


2 5140 0,0 

02,0 0,0 2 5 4 2 
M=|0 0,4 2,0 = diag(41,42,43),com 41 = [o Tas, z|4= 0 

0 0'3 510 

0 0,0 0,7 


Então A(t) é o produto dos polinômios característicos A; (t), A,(t), As(t) de A,, A,, A,, respectivamente. Pode-se 
mostrar que 


Ao) = (1-2), A(t) = (t= 2)(t = 7), As(1)=1—7 
Assim, A(t) = (t — 2 (t— E [Conforme poderíamos prever, o grau de A(t) é 5.] 
Os polinômios mínimos m (1), m,(t), m,(t) dos blocos diagonais A,, A,, A,, respectivamente, são iguais aos 
polinômios característicos, isto é, 


m (i = (1-2), m(t) = (t— 2)(t — 7), ma(t)=t—7 


Mas m(t) é igual ao mínimo múltiplo comum de m(t), m,(t), m(t). Assim, m(t) = (t — 22(t— 7). 


Problemas Resolvidos 


Polinômios de matrizes, polinômios característicos 


9.1 Seja 4 — : E | Encontre f(A), com 
(a) F(A =P -3t+7, (b) F(A =P- 6t+13 
2. dl 2||1 2, 7 12 z 
Para começar, calculamos 4º = 4 sll4 5| =] 24 a Então 


araea a a T 8 


© =e- a itla -alto s= lo ol 


[Assim, A é uma raiz de f(t).] 


9.2 Encontre o polinômio característico A(t) de cada uma das matrizes dadas. 
2 5 7 =3 3 =2 


Usamos a fórmula A(!) = ? — tr(M) t + |M|de matrizes quadradas M de ordem 2. 
@) t(4)=2+1=3, |A|=2-20=-18, logo AD=2-3-18 
(b) tr(B)=7-2=5, Bl=-14+15=1, logo, A)=2-5t+1 
(c) tr(C)=3-3=0, [C|=-9+18=9, logo, A()=2+9 


9.3 Encontre o polinômio característico A(t) de cada uma das matrizes dadas. 


23 1 6 -2 
(a) 4=|3 0 4|,6b) B=|-32 0 
6 45 0 3 —4 
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Usamos a fórmula A(t) = É — tr(A)£ + (411 + 43, + 433)t — |A|, em que 4, é o cofator de a, da matriz qua- 
drada A = [a,] de ordem 3. 


(a) tr(4)=1+045=6, 


0 4 13 12 
4n=|9 5 =-16, An); 5| =-13, 4s =]; o= 
A tAn +A =-—35, e |A| =48+36-— 16-30 =38 
Assim, A(t) = Ë — 6? — 35t — 38 
(b) tr(B)=1+2-4=-1 
2 0 1 -2 6 
Bu=|5 4-8 Ba =) a 4, Ba =| 3 Jea 
B +B» +B3=8, œ |B| = -8 + 18 - 72 = —62 
Assim, Alt) =Ë +P -8t +62 


9.4 Encontre o polinômio característico A(t) de cada uma das matrizes dadas. 


251 1 1122 
142 2 0334 
DA pg gp MG mas 
002 3 000 6 


(a) A é triangular em blocos com blocos diagonais 


2 O O = 
A = e A> = 
1 4 2 3 


Assim, A(t) = A4 (A (t) = (Ê — 6t + 3)(Ë — 9t + 28) 
(b) Como B é triangular, A(t) = (t — 1) (t — 3)(t — 5)(t — 6). 


9.5 Encontre o polinômio característico A(t) de cada um dos operadores lineares dados. 
(a) F:R? — R? definido por F(x,y) = (3x + 5y, 2x— 7y). 
(b) D: V — V definido por D( f) = df /dt, sendo V o espaço de funções com base S = {sen t, cos t}. 


O polinômio característico A(t) de um operador linear é igual ao polinômio característico de qualquer matriz A que 
represente o operador. 


(a) Utilizamos a matriz A que representa T em relação à base canônica de R?. Temos 


3 5 
dl | logo,  A()=P-tr(A)t+|A= 44431 


(b) Utilizamos a matriz A que representa o operador derivada D em relação à base S. Temos 


D(sent) = cost = O(sent) + I(cost) is gat Sl 
D(cost) = —sent = —1 (sent) + O(cost) 8 “dio 


Assim, A(t) = = tr(4) t+ M| = 241 


. Fa DO ENO, 4 
9.6 Mostre que uma matriz A e sua transposta A` têm o mesmo polinômio característico. 


Usando a transposta, (tI — Ay” = tI" — AT = tI — AT. Como uma matriz e sua transposta têm o mesmo deter- 
minante, 


Ali) = -A| = (= 4)7|= | = 47] = Agr) 
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9.7 Demonstre o Teorema 9.1. Sejam fe g polinômios. Dados quaisquer matriz quadrada A e escalar k, 
© (Sr) =MA) +84), GD (OA) = (A), 
GD (J2)(4) =HAg(4), Gv) SA)g(4) = (AFA). 
Sejamf=at"+---+atta e g= bpt” +--+ bt + bo. Então, por definição, 
HA) =a,4" +: +ajA + al e g(4) = bp A” +--+ bA + bol 


Gi) Suponha que m < ne seja b; = 0, com į > m. Então 


f +e = (a, +b,)t" +: + (a, +bi)t + (ao + bo) 
Logo, 
(f +2)(4) = (a, + b,)A" +: + (a; +b1)A + (ao + bo) 
=a," + b," +- +ajA + bA +a + by = f4) +e) 


n+m 
(ii) Por definição, fg = Cam"? +--+ cit + cy = >) cgt, onde 
k=0 
k 
Cp = agby + abr A E ado = 5 ade; 
i=0 


n+m 


Logo, (Jg)(4) = x cA" e 


n P m . nom nt n+m 
saga = (Da) (Eb) = E Saba" = E ed" = (VA) 
i=0 j=0 i=0 j=0 k=0 
Gii) Por definição, kf = ka„t” + --: + kayt + kag e, portanto, 
(ANA) = ka„,A” ++ ka A + kagl = k(a,A" +--+ aA + agl) = kf (A) 
(iv) Por (ii), g(4Y (4) = (8/4) = (Je )(4) =f (4)e(4). 
9.8 Demonstre o Teorema 9.2 (Cayley-Hamilton). Cada matriz A é uma raiz de seu polinômio característico. 
Sejam A uma matriz quadrada de ordem n qualquer e A(t) seu polinômio característico, digamos, 
A(t) = |U -A| = t +a, Hat H a 


Denotemos por B(t) a adjunta clássica da matriz t! — A. Os elementos de B(t) são os cofatores da matriz tl — A e, por- 
tanto, polinômios em £t de grau, no máximo, n — 1. Assim, 


B= B at +. +Bt+Bo 


onde os B, denotam matrizes quadradas de ordem n sobre K que não dependem de t. Pela propriedade fundamental da 
adjunta clássica (Teorema 8.9), temos (tI — A)B(t) = | — A|I, ou 


(tI — A)(B,17! +--+ Bit + Bo) = (O Ega +- H at ao) 
Removendo os parênteses e igualando as potências correspondentes de t, obtemos 
Byam, B,2 — ABp-1 =, 1l, aaa Bo — 4B; =ajl, —AB, = agl 
Multiplicando essas equações por A”, A?!) ..., A, I, respectivamente, resulta 
ABA, ABr AB = Ao, .. ABy-AB=a4,  —AB, = aI 
Somando essas equações matriciais, obtemos 0 do lado esquerdo e A (4A) do lado direito, ou seja, 


0 =A" +a, 14"! +- +ajA + al 


Assim, A(4) = 0, demonstrando o teorema de Cayley-Hamilton. 
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Autovalores e autovetores de matrizes 2 x 2 


pão —4 
9.9 Seja 4 = [5 i 


(a) Encontre todos os autovalores e autovetores associados. 


(b) Encontre matrizes P e D tais que P seja não singular e D = P7!AP seja diagonal. 


(a) Começamos calculando o polinômio característico A(t) de A. 
A(t) = Ê — tr(A) t+ |A| = Ë + 3t — 10 = (t — 2)(t + 5) 


As raízes =2 e ) = —5 de A(t) são os autovalores de A. Calculemos os autovetores associados. 


(i) Subtraímos À = 2 das entradas diagonais de A para obter a matriz M = A — 21, cujo sistema homogêneo 
correspondente MX = 0 fornece os autovetores associados a À = 2. Temos 
1 —4 x—4y=0 


M = p Z que corresponde a 2x —8y=0 ou x—4y=0 


O sistema só tem uma variável livre e v} = (4, 1) é uma solução não nula. Assim, v; = (4, 1) é um autovetor 
associado a (e gerando o subespaço de) À = 2. 


(ii) Subtraímos À = —5 (ou, equivalentemente, somamos 5) das entradas diagonais de A para obter 
8 —4 — 4 = 
M = b 1 | , que corresponde a - o E T E ou 2x—-y=0 


O sistema só tem uma variável livre e vw, = (1,2) é uma solução não nula. Assim, v, = (1,2) é um autovetor 
associado a À = 5. 


(b) Seja P a matriz de colunas v, e v,. Então 


“4a gia [o O 
p=] o poru=[2 9] 


Observe que D é a matriz diagonal cujas entradas diagonais são os autovalores de A associados aos 
autovetores que aparecem em P. 


z 


OBSERVAÇÃO Aqui P é a matriz de mudança de base da base canônica de R? para a base 
S = (v, v,) e D é a matriz que representa (o operador matricial) A em relação à nova base S. 


-ag |2 2 
9.10 Seja 4 = [1 I 


(a) Encontre todos os autovalores e autovetores associados. 

(b) Encontre uma matriz não singular P tal que D = P7!AP seja diagonal e P~! 

(c) Encontre 4º e fA), com É — 3P 6P +HTt+3. 

(d) Encontre uma “raiz cúbica real” de A, isto é, uma matriz B tal que B? = A e B tenha autovalores reais. 


(a) Começamos calculando o polinômio característico A(t) de A. 


AH =F trd) t+ |A =r = 5t+4= (t= =A) 


As raízes = 1 e ) = 4de A(t) são os autovalores de A. Calculemos os autovetores associados. 


(1) Subtraímos À = 1 das entradas diagonais de A para obter a matriz M = A — I, cujo sistema homogêneo 
correspondente MX = 0 fornece os autovetores associados a À = 1. Temos 
x+2y=0 


M = 12 d = 
=| 2b que corresponde a x+2y=0 ou x+2y=0 
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O sistema só tem uma solução independente, por exemplo, x = 2, y = —1. Assim, v, = (2, —1) é um 
autovetor associado a (e gerando o subespaço de) À = 1. 


Gi) Subtraímos À = 4 das entradas diagonais de A para obter 


E e 2 —2x+2y=0 
M=| 1 a que corresponde a din je) ou x-y=0 


O sistema só tem uma solução independente, por exemplo, x = 1, y = 1. Assim, v, = (1,1) é um autovetor 
associado a À = 4. 


(b) Seja P a matriz de colunas v, e v,. Então 


1 0 


| 2 1 -p poa 
E | e  D=P a=; j 


| i com pl 


II 


w= w= 


WIN w= 
Lo 4 


(c) Usamos a fatoração diagonal 4 = PDP”!e, como 1º = 1 e 4º = 4096, obtemos 


2 E, 0 -4 1366 2230 
—1 1/10 4096 E = |1365 2731 
Também K1) = 2 e f(4) = —1. Logo, 


du E Mod 
f(A) = PF(D)P E dif “|| 


4$ = PDP = 


w w 


1 0 
(d) Aqui, É jl é a raiz cúbica real de D. Logo, a raiz cúbica real de A é 


o 2af o 
panmi fo aall 


9.11 Cada uma das matrizes reais dadas define um operador linear de R?. 


5 6 1-1 5 A 
a) 4= [5 50 ï=]; b0 c= [1 | 


Para cada matriz, encontre todos os autovalores e um conjunto § máximo de autovetores linearmente inde- 
pendentes. Qual desses operadores é diagonalizável, ou seja, pode ser representado por uma matriz diagonal? 


wi—= w= 


(a) Começamos calculando A(t) =? — 3t — 28 = (t — 7) (t + 4). As raízes =7 e A= —4 são os autovalores 
de A. Calculemos os autovetores associados. 


G) Subtraímos À = 7 das entradas diagonais de A para obter 


M= k | ; que corresponde a E p E f ou x—3y=0 


A única solução não nula é v; = (3,1). 


(ii) Subtraímos À) = —4 (ou somamos 4) das entradas diagonais de A para obter 
9 6 E E 
M= É | ; que corresponde a - i : e j ou 3x+2y=0 


A única solução não nula é v, = (2, —3). 


Então S = (v,, v,) = ((3, 1), (2, —-3)) é um conjunto máximo de autovetores linearmente independentes. 
Como S é uma base de R?, A é diagonalizável. Em relação à base S, A é representada pela matriz diagonal D = 
diag(7, —4). 


(b) Começamos calculando o polinômio característico A(t) = t? + 1. Não há raízes reais. Assim, B é uma matriz real 
que representa um operador linear de R? que não tem autovalores e não tem autovetores. Logo, em particular, B não 
é diagonalizável. 


9.12 


9.13 
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(c) Começamos calculando A(t) = ? — 8t + 16 = (t — 42. Assim, À = 4é o único autovalor de C. Subtraímos À = 4 
das entradas diagonais de C para obter 
1 <=] 
M = 1a que corresponde a x—y=0 
O sistema homogêneo tem uma única solução independente, por exemplo, x = 1, y = 1. Assim, v = (1, 1) é um 
autovetor de C. Mais que isso, como não há outros autovalores, o conjunto S = {v} = ((1, 1)) de um elemento é 


um conjunto máximo de autovetores linearmente independentes de C. Em particular, como S não é uma base de 
2 ~ q . 4 Z 
Rº, C não é diagonalizável. 


Considere o operador linear B do espaço complexo C definido pela matriz B do Problema 9.11. Mostre que, 
nesse caso, B é diagonalizável, encontrando uma base S de C? consistindo em autovetores de B. 


O polinômio característico de B ainda é A(t) = £ + 1. Como um polinômio sobre C, A(t) fatora, já que 
A(t) = (t — i)(t+i).Assim,) =i e ) = —i são os autovalores de B. 
(G) Subtraímos À = i das entradas diagonais de B para obter o sistema homogêneo 

(1 — Dx — y=0 


2x + (—1—i)y=0 é =p = 


O sistema só tem uma solução independente, por exemplo, x = 2, y = 1 — i. Assim, v; = (1, 1 — i) é um 
autovetor que gera o subespaço de À = i. 


(ii) Subtraímos 4 = —i (ou somamos i) das entradas diagonais de B para obter o sistema homogêneo 


(1 + ix — y=0 


selpi MW Urgen 


O sistema só tem uma solução independente, por exemplo, x = 1, y = 1 + i. Assim, v, = (1, 1 +i)éum 
autovetor que gera o autoespaço de À = —i. 


Como uma matriz complexa, B é diagonalizável. Mais precisamente, S = ([v,, v} = {(1, 1 — i), (1,1 + i)} é uma base 
de C? consistindo em autovetores de B. Usando essa base S, B é representada pela matriz diagonal D = diag(i, —i). 


Seja L o operador linear de R? que reflete cada ponto P pela reta y = kx, com k > 0 fixado. (Ver Figura 9-1.) 
(a) Mostre que vı = (k,1) e v, = (1, —k) são autovetores de L. 


(b) Mostre que L é diagonalizável e encontre uma representação diagonal D de L. 


y L(P) 
e 


Figura 9-1 


(a) O vetor v; = (k, 1) determina um ponto da reta y = kx e, portanto, é mantido fixado por L, isto é, L(v1) = v4. 
Assim, v; é um autovetor de L associado ao autovalor À, = 1. 
O vetor vw, = (1, —k) é perpendicular à reta y = kx e, portanto, L reflete v, em seu simétrico, isto é, 
L(v,) = — v. Assim, v, é um autovetor de L associado ao autovalor À, = —1. 
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(b) Dessa forma, S$ = (v,, v,) é uma base de R? consistindo em autovetores de L. Assim, L é diagonalizável, com a 


0 
representação matricial D = o | (em relação à base S$). 


0 
Autovalores e autovetores 
4 1 -1 
9.14 Seja 4 = |2 5 —2 | (a) Encontre todos os autovalores de A. 
1 1 2 


(b) Encontre um conjunto S$ máximo de autovetores linearmente independentes de A. 
(c) A é diagonalizável? Se for, encontre P tal que D = P-!AP seja diagonal. 


(a) Começamos calculando o polinômio característico A(t) de A. Temos 
tr(4)=44+5+2=11 e 4/=40-2-2+5+8-4=45 


Também calculamos cada cofator A, de a, em A. 


5 —2 4 -l 4 1 
“=li Je ‘n=l o As=5 5|=18 
Logo, A(t) =Ë -t(A)P + (Ai + Ao + 433)t — |A| = Ë — 12 + 39t — 45 


Supondo que A(t) tenha alguma raiz racional, os candidatos são +1, +3, +5, +9, +15, +45. Testando por 
Ruffini, obtemos 


3| 1—11+39-—45 
3—24 +45 
1=8415+ 0 


Assim, t = 3 é uma raiz de A (f). Também + — 3 e? — 8t + 15 são fatores. Logo, 


Por isso, A =3 e AÀ = 5 são autovalores de A. 
(b) Calculamos autovetores linearmente independentes para cada autovalor de A. 


(G) Subtraímos À = 3 das entradas diagonais de A para obter a matriz 


1 1 
M=|2 2 2], correspondente a x+y-z=0 
1 1 


Logo, u = (1,—1,0) e v= (1,0, 1)são soluções linearmente independentes. 


Gi) Subtraímos À = 5 das entradas diagonais de A para obter a matriz 


-1 1 + -x+y— z=0 Er, 
M = 20 —2 correspondente a 2x — 22=0 ou E a = 
1 1 -3 x+y-32=0 PESA 


A única variável livre é z. Logo, w = (1,2, 1) é uma solução. 


Assim, S = {u, v, w} = ((1,-1,0), (1,0, 1), (1,2, 1)) é um conjunto máximo de autovetores de A linearmente inde- 
pendentes. 


OBSERVAÇÃO Os vetores u e v foram escolhidos como soluções independentes do sistema dado por x + y — z 
= Q. Por outro lado, w é, automaticamente, independente de u e v, porque w pertence a um autoespaço diferente de 
A. Assim, os três vetores são linearmente independentes. 
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(c) A é diagonalizável porque tem três autovetores linearmente independentes. Seja P a matriz de colunas u, v, w. 


Então 
1 1 1 3 
P=|-102 e D =P`AP = 3 
0 1 1 5 
3 =l 1 
9.15 Repita o Problema 9.14 com a matriz B = |7 —5 1 
6 —6 2 


(a) Começamos calculando o polinômio característico A(t) de B. Temos 


tr(B) =0, |B|=-16, By=-4, Byp=0, B3, =-8, portanto, $` B;= -12 
i 


Logo, A(t) = P — 12t + 16 = (t — 2)° (t + 4). Assim, 2} =2 e À = —4 são os autovalores de B. 
(b) Calculamos uma base do autoespaço de cada autovalor de B. 


(1) Subtraímos À, = 2 das entradas diagonais de B para obter 


1 —1 1 x— y+z=0 ai 
M=|I7 -7 1 correspondente a X-W+z=0 ou ind 
6 -6 0 6x—-6y =0 o 


O sistema só tem uma solução independente, por exemplo, x = 1, y = 1, z = 0. Assim, u = (1,1,0) constitui 
uma base do autoespaço de À, = 2. 


(ii) Subtraímos À, = —4 (ou somamos 4) das entradas diagonais de B para obter 
A | X- y+ z=0 o 
M=|7 -1 1 correspondente a Tx= y+ z=0 ou is dd 
6 —6 6 6x— 6y+62=0 casi 


O sistema só tem uma solução independente, por exemplo, x = 0, y = 1,27 = 1. Assim, v = (0, 1, 1) constitui 
uma base do autoespaço de À, = —4. 


Assim, S = (u, v) é um conjunto máximo de autovetores de B linearmente independentes. 


(c) Como B tem, no máximo, dois autovetores linearmente independentes, B não é semelhante a uma matriz diagonal, 
ou seja, B não é diagonalizável. 


9.16 Encontre as multiplicidades algébrica e geométrica do autovalor À, = 2 da matriz B do Problema 9.15. 


A multiplicidade algébrica de À, = 2 é 2, porque t — 2 aparece com expoente 2 em A(t). Contudo, a multiplicidade 
geométrica de À, = 2é 1, porque E; = 1 (sendo E, o autoespaço de 2). 


9.17 Seja T:R? — R? definido por T (x,y,z) = (2x +y — 2z, 2x+3y-— 4z, x+y- z). Encontre todos 
os autovalores de T e uma base em cada autoespaço. T é diagonalizável? Se for, encontre uma base S de Rº 
que diagonaliza T e encontre sua representação diagonal. 


Inicialmente encontramos a matriz A que representa T na base canônica de Rº, escrevendo os coeficientes de x, y, z 
como linhas e depois calculamos o polinômio característico de A (e de 7). Temos 


2 1 -2 t(4)=4, |4|=2 
A=[7]=|2 3 —4 e An), An =0, 43 =4 
11 ~ Pas 


Logo, A(t) = Ë -4 + 5t—2 = (t 1} (t 2) e, portanto, A=1 e å = 2 são os autovalores de A (e de T). 
Agora, calculamos autovetores linearmente independentes de cada autoespaço de A. 
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9.18 


9.19 


9.20 


9.21 


(G) Subtraímos À = 1 das entradas diagonais de A para obter a matriz 


1 1 -2 
M=|2 2 —4 correspondentea x+y-—2z=0 
1 1 -2 


As variáveis livres são y e z, portanto existem dois autovetores linearmente independentes associados a = 1. 
Por exemplo, u = (1,—1,0) e wv = (2,0, 1) são dois desses autovetores. 


Gi) Subtraímos À = 2 das entradas diagonais de A para obter 


0 -2 y-2z=0 x+y-32=0 
M=|2 1 —4 correspondente a 2x+y— 42=0 ou E 
1 -3 x+y-3z=0 Jas 


A única variável livre é z. Logo, w = (1, 2, 1) é uma solução. 


Assim, T é diagonalizável, porque tem três autovetores linearmente independentes. Mais precisamente, escolhendo 
S = {u, v, w} = {(1, —1, 0), (2, 0, 1), (1, 2, 1)} 


como base, T é representado pela matriz diagonal D = diag(1, 1, 2). 


Mostre as afirmações seguintes relativas a um operador linear (matriz) T. 
(a) O escalar O é um autovalor de T se, e só se, T é singular. 
(b) Se À é um autovalor de Te T é invertível, então 1! é um autovalor de T7} 


(a) Temos que O é um autovalor de T se, e só se, existe um vetor v Æ 0 tal que T(v) = Ov = 0, isto é, se, e só se, T é 
singular. 


(b) Sendo invertível, T é não singular. Logo, por (a), À Æ 0. Pela definição de autovalor, existe v Æ 0 tal que T (v) = du. 
Aplicando T7! a ambos lados, obtemos 


v=T(Av)=AT (o) eportanto, THwv=Aly 


Assim, 2! é um autovalor de T-!. 


Seja À um autovalor de um operador linear T: V — V e seja E; o conjunto de todos autovetores associados a 
À (denominado autoespaço de 2). Prove que E; é um subespaço de V, ou seja, prove as afirmações seguintes. 


(a) Seu € E, então ru € E,, para cada escalar r. (b) Se u, v, € E; então u + v € E}. 


(a) Como u € E, temos T (u) = Ju. Então T (ru) = rT (u) = r (àu) = A(ru), de modo que ru € E;. 
(Interpretamos o vetor nulo O € V como um “autovetor” de 2 para que E; seja um subespaço de V.) 
(b) Como u,v € E;, temos T(u) = Ju e T(v)= Av. Então T(u + v) =T()+T(v)=Au+hv=Au-+v)e, 
portanto, u + v € Es. 
Demonstre o Teorema 9.6. As afirmações dadas são equivalentes. (i) O escalar À é um autovalor de A. 
(ii) A matriz ÀI — A é singular. 
(iii) O escalar À é uma raiz do polinômio característico A(t) de A. 
O escalar À é um autovalor de A se, e só se, existe um vetor não nulo v tal que 


Av = Av ou (1l)v-Av=0 ou ()1-4)v=0 


ou AJ — A é singular. Nesse caso, À é uma raiz de A(t) = |tI — A|. Também, v está no subespaço E; de À se, e só se, 
valer essa relação. Logo, v é uma solução de (AI — A)X = 0. 


Demonstre o Teorema 9.8”. Suponha que v,, w,, ..., v, sejam autovetores de T associados a autovalores distin- 
tos 21,42, - - - , Ap: Então v,, v,, ..., v, são linearmente independentes. 
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Vamos supor que o teorema seja falso. Seja v,, v, ..., v, um conjunto mínimo de vetores para o qual o teorema seja falso. 
Temos s > 1, porque vı Æ 0, já que é autovetor. Também, pela condição de minimalidade, v,, ..., v, é linearmente inde- 
pendente. Assim, v, é uma combinação linear de v,, ..., V, digamos, 


V1 = A20 + 0303 + ta, (1) 
(onde algum a, 0). Aplicando T a (1) e usando a linearidade de T, obtemos 
Tv) =T(aw +aw++av)=aT(w)+asT(w)+---+aTt(v,) (2) 


Como v; é um autovetor de T associado a A, temos 7 (v;) = Aju. Substituindo em (2), resulta 


AU = dA Uz + az h3 V3 EE AAs Us (3) 


Multiplicando (1) por 44, obtemos 


Av = a321 v + azh U3 + + ash Us (4) 


Igualando os lados direitos de (3) e (4), ou subtraindo (3) de (4), resulta 


an(hy — do)uz + a3 (4 — Aa)us +: + asli —A)u, = 0 (5) 


Como v,, v;, ..., V, são linearmente independentes, os coeficientes de (5) devem ser, todos, nulos, ou seja, 


a(i — 22) =0, as(h — À) = 0, e’ ad — Às) =0 


Contudo, os À; são distintos. Logo, 4 — 4; £ O para j> 1. Assim, a, = 0, a; = 0,...,a, = 0. Isso contradiz o fato de 
que algum a, + 0. O teorema está provado. 


9.22 Demonstre o Teorema 9.9. Suponha que o polinômio característico A(t) = (t — a)(t—- a2) . .. (t — a,) de 
uma matriz quadrada A de ordem n seja um produto de n fatores distintos, digamos, a;. Então A é semelhan- 
te à matriz diagonal D = diag(a,, a,, ..., a,). 


Sejam v,, V, ..., U, autovetores (não nulos) associados aos autovalores a,. Então os n autovetores v; são linearmente inde- 
pendentes (Teorema 9.8) e, portanto, formam uma base de K”. Dessa forma, A é diagonalizável, isto é, A é semelhante a 
uma matriz diagonal D, e os elementos diagonais de D são os autovalores a. 


9.23 Demonstre o Teorema 9.10”. A multiplicidade geométrica de um autovalor À de T não é maior do que a mul- 
tiplicidade algébrica. 


Suponha que a multiplicidade geométrica de 2 seja r. Então o autoespaço E; desse autovalor contém r autovetores line- 
armente independentes v,, ..., v,. Estendemos o conjunto (v,) a uma base de V, digamos, (v,,...,U,,W1,-.., W,). Então 


T(v) = Au, T(v) = Au, RE T(v,) = Åv, 


Tw)=am+ + aU, + biwi + biw, 


T(w2) = a01 + + aa, U, + bawi ++ bow, 
T(w,) = 4g 7 T AsrU, H baw: t H bss Ws 
: $ 41, A T T 
A matriz de T nessa base é M = 0 B | com A = [a] eB = [b,). 


Como M é diagonal em blocos, o polinômio característico (t — À)” do bloco AZ, deve dividir o polinômio característico 
de M e, portanto, de T. Assim, a multiplicidade algébrica de À para T é r, no mínimo, como queríamos mostrar. 


Diagonalização de matrizes reais simétricas e formas quadráticas 


7 3 
9.24 Seja Á = E 4 | Encontre uma matriz ortogonal P tal que D = P-!AP seja diagonal. 
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Começamos calculando o polinômio característico A(t) de A. Temos 


A(t) = Ê — tr(A) t+ |A| = Ë — 6t — 16 = (t — 8)(t + 2) 


Assim, os autovalores de A são) = 8 e À = —2. Em seguida, calculamos os autovetores associados. 
Subtraímos À = 8 das entradas diagonais de A para obter a matriz 


= 3 o — 
M = | 3 E correspondente a a i E = ; ou x—3y=0 
Uma solução não nula é u, = (3,1). 
Subtraímos À = —2 (ou somamos 2) das entradas diagonais de A para obter a matriz 
9 3 = 
M = | 31 | correspondente a - j z : ou 3x+y=0 


Uma solução não nula é u, = (1, —3). 
Como era de se esperar, dada a simetria de A, os autovetores u, e u, são ortogonais. Normalizamos u, e u, para obter, 
respectivamente, os vetores unitários 


û, = (3/N10,1/V10) e û, = (1/V10, —3/ v10). 


Finalmente, seja P a matriz cujas colunas são os vetores unitários à e ú, respectivamente. Então 


[vo uvo] -atp fe O 
o ~ D=P 4p= [o E 


Conforme previsto, as entradas diagonais de D são os autovalores de 4. 


11 —8 4 
9.25 SejaB = | -8 —1 —2 | (a) Encontre todos os autovalores de B. 
4 -2 4 


(b) Encontre um conjunto S$ máximo de autovetores ortogonais de B. 
(c) Encontre uma matriz ortogonal P tal que D = P-! BP seja diagonal. 


(a) Começamos calculando o polinômio característico de B. Temos 


tr(B) = 6, |B| = 400, Bı =0, Ba = —60, B;y = —75, portanto, `B; = —135 
i 


Logo, A(t) = É — 6? — 135t — 400. Se A(t) tiver alguma raiz inteira, os candidatos devem dividir 400. 
Testando t = —5, por Ruffini obtemos 


| 6 — 135 — 400 
5+ 55+ 400 
1—11— 80+ 0 


Assim, t + 5 é um fator de A(t), e £ — 11t — 80 também é um fator. Assim, 
A(t) = (t+ S)(P — 11t — 80) = (t+ 5) (t — 16) 


Os autovalores de B são À = —5 (multiplicidade 2) e À = 16 (multiplicidade 1). 
(b) Encontremos uma base ortogonal de cada autoespaço. Subtraímos À = —5 (ou somamos 5) das entradas diagonais 
de B para obter o sistema homogêneo 


16x — 8y + 4z = 0, —8x + 4y — 2z = 0, 4x —2y+z=0 


Logo, 4x — 2y + z = 0. O sistema tem duas soluções independentes. Uma solução é vı = (0, 1,2). 
Procuramos uma segunda solução v, = (a, b, c) que seja ortogonal a v,, ou seja, 


4a-2b+c=0 e, portanto, b-2c=0 
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Uma tal solução é v, = (—5, —8, 4). 
Subtraímos À = 16 das entradas diagonais de B para obter o sistema homogêneo 


—5x — 8y+42=0, 8x — 17y — 2z = 0, 4x — 2y — 20z = 0 


Esse sistema fornece uma solução não nula v3 = (4, —2, 1). (Como afirma o Teorema 9.13, o autovetor v, é 
ortogonal a v, e v.) 
Então v,, v,, v; formam um conjunto máximo de autovetores ortogonais (não nulos) de B. 


(c) Normalizamos v,, v,, v, para obter uma base ortogonal 
dy = v/V5, d=0/V105, dú=uw/v2l 


Então P é a matriz cujas colunas são d,, ô, ô. Assim, 


0  —5//105 4/21 -5 
P=|1//5 -—8/v105 -—2/v21 e D=P BP 5 
2/5  4/v105  1/v21 16 


9.26 Seja q(x, y) = x? + 6xy — 7y°. Encontre uma substituição ortogonal que diagonalize q. 


Começamos com a matriz simétrica A que representa q e seu polinômio característico A(t). Temos 


Am |; E e A(O) =P +6t— 16 = (t—2)(t+ 8) 


Os autovalores de A são) =2 e A = —8. Assim, usando as novas variáveis s e t, uma forma diagonal de q é 
qls, t) = 2° — 8P 


A substituição ortogonal correspondente é obtida a partir de um conjunto ortogonal de autovetores de A. 


(G) Subtraímos À = 2 das entradas diagonais de A para obter a matriz 


=1 3 —x+3y=0 
M = correspondente a = = 
| 3 E) P 3x— 9y = 0 ou x+3y=0 
Uma solução não nula é u; = (3,1). 
Gi) Subtraímos À = —8 (ou somamos 8) das entradas diagonais de A para obter a matriz 
9-3 = 
M = k | | correspondente a - E 7 — : ou 3x+y=0 


Uma solução não nula é u, = (—1,3). 
Como era de se esperar, dada a simetria de A, os autovetores u, e u, são ortogonais. 
Agora normalizamos u, e u, para obter, respectivamente, os vetores unitários 


û = (3/V10, 1/4110) e do = (=1//10, 3/10). 


: ; Eca m Dania E E ” T To 
Finalmente, seja P a matriz cujas colunas são os vetores unitários à, e û,, respectivamente. Então [x,y] = P[s, t] é 
a mudança de coordenadas ortogonal procurada, ou seja, 


3/v10 —1/v10 E pt E e 
1/V1O  3/V10 “vo “vo 


Também podemos expressar s e f em termos de x e y usando P7! = P7, ou seja, 


3x +y po XE 


vão * v10 
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Polinômio mínimo 


9.27 


9.28 


9.29 


4 -2 2 3 -2 2 
Sejam A= |6 —3 4| e B=|4 —4 6|. O polinômio característico de ambas matrizes é 
3 -2 3 2 —3 5 


A(t) = (t — 2)(t — ne Encontre o polinômio mínimo m(t) de cada matriz. 


O polinômio mínimo m(t) deve dividir A(t). Também, cada fator de A(t) (ou seja, t — 2 e t — 1) deve ser, também, 
fator de m(t). Assim, m(t) é exatamente um dos dois polinômios seguintes. 


fA =(t-2)(-1) ou g(t) =(t- 2t- 1) 


(a) Pelo Teorema de Cayley-Hamilton, g(4) = A(4) = 0, de modo que basta testar f(t). Temos 


2 —2 2||3 -2 2 0 0 0 

fa =A4-2N4-D)=16 -5 4||6 -4 4|=[0 00 

3 =2 1 3 —2 2 0 0 0 

Assim, m(t) = f (t) = (t — 2) (t — 1) = Ê — 3t + 2 é o polinômio mínimo de A. 
(b) Novamente, g(B) = A(B) = 0, de modo que basta testar f(t). Obtemos 
1 -2 2 2 22 -22 2 
fB)=(B-2N(B-1)=|4 -6 6ll4 -5 6|=]|-4 4 -4| #0 
2 -3 3 2 -3 4 —2 2 -2 


Assim, m(t) £ f (t). Em vista disso, m(t) = g(t) = (t — 2) (t TE é o polinômio mínimo de B. [Enfatizamos 
que não é necessário calcular g(B), pois o Teorema de Cayley-Hamilton garante que g(B) = 0.] 


Encontre o polinômio mínimo m(t) de cada uma das matrizes dadas. 
123 

(a) A= f |© B=|0 2 3|, (© C= í E 
0 03 


(a) O polinômio característico de A é A(t) = É — 12t + 32 = (t — 4)(t — 8). Como A(t) tem fatores distintos, o 
polinômio mínimo m(t) = A(t) = É — 12t + 32. 


(b) Como B é triangular, seus autovalores são os elementos diagonais 1, 2, 3 e, então, seu polinômio característico é 
A(t) = (t — 1) (t — 2) (t — 3). Como A(t) tem fatores distintos, m(t) = A(t). 


(c) O polinômio característico de C é A(t) = Ê — 6t +9 = (t — 3)”. Logo, o polinômio mínimo de C é 
f(t) =t -3 oug(t) = (t — 3}. Contudo, f (C) £ 0, ou seja, C — 31 £ 0. Logo, 


m(t) = g(t) = A(} = (1-3. 


Seja S = (u,, u, ..., U, } uma base de Ve suponha que F e G sejam operadores de V tais que [F] tem zeros 
na diagonal e abaixo dela e que [G] tem a +Æ 0 na superdiagonal e zeros no resto. Ou seja, 
(0) do, 31 isr dnl O a O sou O 
0 0 a... a 00 a... 0 
[E | = isa asadsas gra da ; (G= ciiai 
0 0 0 An 000 a 
0 0 0 0 000 0 


Mostre que (a) F” = 0, (b) @™! Z0, mas G” = 0. (Essas condições também valem para [F] e [G].) 


(a) Temos F(u,) = 0e, parar > 1, F(u,) é uma combinação linear de vetores que precedem u, em S. Ou seja, 


F(u,) = QU1 E a,u ese SF A, y-1M,-1 


9.30 


9.31 


9.32 


9.33 
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Então, F2(u,) = F(F(u,)) é uma combinação linear de vetores que precedem u, | e assim por diante. Logo, 
F"(u,) = O para cada r. Assim, para cada r, F” (u,) = F” (0) = Oe, portanto, F” = 0, como queríamos mostrar. 

(b) Temos G(u,) = 0 e, para cada k > 1, G(u;) = au, , Logo, G” (up) = a”up., para r < k. Como a Æ 0, também 
a"! £ 0. Portanto, G~! (u,) = a" lu, £ 0e, assim, G”! Æ 0. Por outro lado, (a) afirma que G” = 0. 


Seja A a matriz do Exemplo 9.12(a) que tem um À em cada entrada diagonal, a em cada entrada superdiago- 
nal, com a Æ 0, e zeros nas demais. Mostre que f (t) = (t — 2)” é tanto o polinômio característico quanto 
o polinômio mínimo m(t) de A. 
Como A é triangular, com À na diagonal, A(t) = f (t) = (t — 1)" é o polinômio característico de A. Assim, m(t) é 
uma potência de t — À. Pelo Problema 9.29, (A — ary! # 0. Logo, m(t) = A(t) = (t — 2)”. 


Encontre o polinômio característico A(t) e o polinômio mínimo m(t) de cada matriz dada. 


41000 27 o 0 
04 100 02 00 
()M=[|00 40 0l, ®© M= 
0 0 1 1 
00041 E sh 
0000 4 
(a) M é diagonal em blocos com blocos diagonais 
4 1 0 
A=|0 4 1 e ssl 1l 
0 0 4 


O polinômio característico e mínimo de A é f(t) = (t — 4} e o polinômio característico e mínimo de B é 
g(t) = (t — 4)?. Então 


A(t) =f(Dg(t) = (t4), mas mO = MMCIfO), g(D] = (1— 4 


(onde MMC significa o mínimo múltiplo comum). Enfatizamos que o expoente de m(t) é o tamanho do maior 
bloco. 


(b) Aqui, M' é diagonal em blocos com blocos diagonais 4' = É l e B' = E a O polinômio 


característico de A’ é f (t) = (t — 2)”, que tem fatores distintos. Logo, g(t) também é o polinômio mínimo de B. 
Em vista disso, 


A(O) =f) = (1-2) (1-3), mas  m() = MMC, g0] = (1-2 — 3) 


Encontre uma matriz A cujo polinômio mínimo seja f (t) =? — 82 + 5t +7. 
0 0 —7 
Simplesmente tomamos 4 = | 1 0 —5 |, a matriz companheira de f(t) [definida no Exemplo 9.12(b).] 
0 1 8 


Demonstre o Teorema 9.15. O polinômio mínimo m(t) de uma matriz (operador linear) A divide qualquer 
polinômio que tenha A como raiz. Em particular (pelo Teorema de Cayley-Hamilton), m(t) divide o polinô- 
mio característico A(t) de A. 

Seja f(t) um polinômio tal que fA) = 0. Pelo algoritmo da divisão, existem polinômios q(t) e r(t) tais que 
f(t) = m(ta(t) + r(t) e r(t) = 0 ou, então, o grau de r(f) é menor do que o grau de m(?). Substituindo + = A nessa 
equação e usando que f(A) = 0 e m(A) = 0, obtemos r(A) = 0. Se r(t) 0, então r(t) é um polinômio de grau menor 
do que m(t) que tem A como zero. Isso contradiz a definição de polinômio mínimo. Assim, r(t) = 0 e, portanto, f(t) = 
m(t)g(t), ou seja, m(t) divide ft). 
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9.34 Seja m(t) o polinômio mínimo m(t) de uma matriz quadrada A de ordem n. Prove que o polinômio caracte- 


9.35 


9.36 


9.37 


rístico A(t) de A divide [m(?)]". 


Suponha que m(t) = +ctT! +... +c, t+ c, Definimos matrizes B, como segue. 


Bı =1 logo I= Bo 
B, =4+cI logo cıl = B, — A = B, — AB, 
B, =£ +caA +e logo cl = B, — A(A + cI) = B, — AB, 


Bia =A! +A eal logo  c,_l = B,_ı — 4B,_2 


Então 
-AB, =c, — (4 +A! +- +e, 4+ cI) [= cI- m(A) = cI 
Definindo B() = 71 Bo + TB + + tB, +B, 
obtemos 
(tI — A)B(t) = (tB) + Be) (AB, 40 AB, +- +4AB,1) 

= fB + f~! (B; — AB) + AB, AB) SAAB, | AB) ABA 

=] Let +o I+- +e, atl + cI = mA 
Tomando o determinante de ambos lados, resulta |t — A||B(t)| = |m(ÐI| = [m(t)]". Como |B(Ð| é um polinômio, 


|t — A| divide [m(t)]", ou seja, o polinômio característico de A divide [m(t)]". 


Demonstre o Teorema 9.16. O polinômio característico A(t) e o polinômio mínimo m(f) de uma matriz A 
têm os mesmos fatores irredutíveis. 


Seja f(t) um polinômio irredutível. Se f(t) divide m(t), então f(t) também divide A(t) [porque m(t) divide A(t)]. Por outro 
lado, se f(t) divide A(t), então, pelo Problema 9.34, f(t) também divide [m(1)]". No entanto, f(t) é irredutível, portanto, 
f(t) também divide m(?). Assim, m(f) e A(t) têm os mesmos fatores irredutíveis. 


Demonstre o Teorema 9.19. O polinômio mínimo m(t) de uma matriz diagonal em blocos M com blocos 
diagonais 4, é igual ao mínimo múltiplo comum (MMC) dos polinômios mínimos dos blocos diagonais 4,. 


Demonstramos o teorema no caso r = 2, sendo que o caso geral decorre por indução. Seja M = Ê J 
eB 
matrizes quadradas. Queremos mostrar que o polinômio mínimo m(t) de M é o MMC dos polinômios mínimos g(t) e 
h(t) de A e B, respectivamente. 
m(A) 0 
0 m(B) 
é o polinômio mínimo de A, g(t) divide m(t). Analogamente, A(t) divide m(t). Assim, m(t) é um múltiplo de g(t) e h(t). 
fa 0 (10 0] on 
0 f(B) =“ dg o| * o entanto, m(t) é o 


polinômio mínimo de M, de modo que m(t) divide f(t). Assim, m(t) é o MMC de g(t) e A(t). 


Como m(t) é o polinômio mínimo de M, temos M, m(M) = | | = 0 e m(A) = 0 e m(B) = 0. Como g(t) 


Seja, agora, f(t) um múltiplo qualquer de g(t) e A(?). Então f (M j= 


Seja m(t) = t + atl +- tatt ag o polinômio mínimo de uma matriz quadrada A de ordem n. 
Prove as afirmações seguintes. 


(a) A é não singular se, e só se, o termo constante ay Æ 0. 
(b) Se A é não singular, então 47! é um polinômio em A de grau r — 1 <n. 


(a) São equivalentes. (i) A é não singular, (ii) O não é uma raiz de m(t), (iii) aọ O. Assim, a afirmação é verdadeira. 
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(b) Como A é não singular, temos ay O por (a). Temos 


m(4) =A" +a 4! +...+aA+tal=0 
: 1 r— r-2 
Assim, -7⁄4 +a st ++aDA=T 
0 
Lo, 
Dessa forma, = re (AT +a, A +. a) 
0 


Problemas Complementares 


Polinômios de matrizes 


5 1 
P= prr: 


9.38 Sejam 4 = [5 | e tel 3 


l E Encontre f(A), g(A), JB), g(B), com f(t) = 2P — 5t +6 e g(t) = 


i 1 2 DAS an =j 
9.39 Seja 4 = 0 1 | Encontre A“, A`, A", com n >3,e A ; 


8 12 0 
9.40 SejaB = |0 8 12 |, Encontre uma matriz real A tal que B = 4º. 
0 0 8 


9.41 Para cada matriz dada, encontre um polinômio que tem a matriz como raiz. 
l 


1 2 
2 5 2 -3 

(a) a=] Jo s=| Lo c= 2 3 
1 -3 7 —4 A 


9.42 Sejam A uma matriz quadrada e f(f) um polinômio quaisquer. Prove que (a) (P7!AP)” = P-lA"P.(b) f(P7'AP) = 
PIF(AJP. (c) F(AT) = [f(4)]". (d) Se A é simétrica, então KA) é simétrica. 


9.43 Sejam M = diaglA,, ..., A,] uma matriz diagonal em blocos e f(t) um polinômio quaisquer. Mostre que f(M) é diagonal 
em blocos e que fM) = diagIHA), .... AA]. 


9.44 Sejam M uma matriz triangular em blocos com blocos diagonais 4,, ..., A, e f(t) um polinômio quaisquer. Mostre que 
FM) é triangular em blocos com blocos diagonais f(A), ..., KA). 


Autovalores e autovetores 


9.45 Para cada uma das matrizes dadas, encontre todos os autovalores e autovetores linearmente independentes associados. 


Ja 2 4 1-4 
(3) 4-5 5) 0 s=[4 NRO c=; 5] 


Quando possível, encontre a matriz não singular P que diagonaliza a matriz. 


Ee gue | 27 = 
9.46 Seja 4 = É 7 


(a) Encontre os autovalores e autovetores associados. 
(b) Encontre uma matriz não singular P tal que D = P-!AP seja diagonal. 
(c) Encontre A*e ÑA), com f(t) = — 5P +7 — 2t +5. 


(d) Encontre uma matriz B tal que B =A. 
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9.48 


9.49 


9.50 


9.51 


9.52 


9.53 


9.54 


9.55 


Repita o Problema 9.46 com 4 = | E: E : 


Para cada uma das matrizes dadas, encontre todos os autovalores e um conjunto § máximo de autovetores linearmente 


independentes. 
l =3 3 3 =l 2 2 
(a) 4=|3 -5 3|,(b) B=|[7 -5 1l|,(c) C= 12 + 
6 —6 4 6 —6 2 =1 1 4 


Quais matrizes podem ser diagonalizadas, e por quê? 


Para cada um dos operadores lineares T: R? — R? dados, encontre todos os autovalores e uma base de cada autoespaço. 


(a) T(x,y)= (3x+3y, x+ 5y), (b) T(x, y) = (3x — 13y, x — 3y). 


. a b f no . . E 
Seja 4 = f d | uma matriz real. Encontre condições relativas a a, b, c, d que sejam necessárias e suficientes para que 


A seja diagonalizável, isto é, para que A tenha dois autovetores (reais) linearmente independentes. 


Mostre que as matrizes A e A têm os mesmos autovalores. Dê um exemplo de uma matriz 2 x 2A tal que A e A” tenham 
autovetores diferentes. 


Seja v um autovetor dos operadores lineares F e G. Mostre que v também é um autovetor do operador linear kF + k'G, 
com ke k' escalares. 


Seja v um autovetor de um operador linear T associado ao autovalor À. Demonstre. 
(a) Paran > 0, v é um autovetor de T” associado a À”. 


(b) f(4) é um autovetor de f(T), para qualquer polinômio ff). 


Seja À Æ 0 um autovalor da composta F o G dos operadores lineares F e G. Mostre que À também é um autovetor da 
composta G o F. [Sugestão: mostre que G(v) é um autovetor de G o F.] 


Seja E: V — V uma projeção linear, isto é, tal que E = E. Mostre que E é diagonalizável e que, de fato, pode ser repre- 


sentada pela matriz diagonal M = em que r é o posto de E. 


0 
0 oop 


Diagonalização de matrizes reais simétricas e formas quadráticas 


9.56 


9.57 


9.58 


9.59 


Para cada uma das matrizes simétricas A dadas, encontre uma matriz ortogonal P e uma matriz diagonal D tais que 
D = P'AP. 


5 4 4 — 7 3 
(a) IF a: (b) TE il (0) a=); E] 


Para cada uma das matrizes simétricas B dadas, encontre seus autovalores, um conjunto ortogonal máximo S de autove- 
tores e uma matriz ortogonal P tal que D = P-!BP seja diagonal. 


011 22 q 
@ B=|1 0 1l, (b) B=|2 5 8 
110 4 8 17 


Usando variáveis s e t, encontre uma substituição ortogonal que diagonalize cada uma das formas quadráticas dadas. 
(a) q(x, y) = 4? + 8x- 11y, 6) q@,y) = 2x — 6xy + 107 


Para cada uma das formas quadráticas q(x, y, z) dadas, encontre uma substituição ortogonal que expresse x, y, z em 
termos das variáveis r, s, t e encontre g(r, s, f). 


(a) q(x, y, Z) = 5x? + 3y? + 12xz, (b) q(x, y, Zz) = 3x? — 4xy + 6y? + 2xz — 4yz + 37? 


9.60 
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Encontre uma matriz simétrica 2 x 2 A com autovalores 
(a) A=1 e )=4eautovetor u = (1, 1) associado a À = 1; 
(b) 4=2 e À = 3eautovetor u = (1, 2) associado a À = 2. 


Em cada caso, encontre uma matriz B tal que B? = A. 


Polinômios característico e mínimo 


9.61 Encontre os polinômios característico e mínimo de cada uma das matrizes dadas. 
3 1 — 3 2 -l 
(a) A= 2 4 2I,(b) B=|3 8 —3 
=] =l 3 3 6 =] 
9.62 Encontre os polinômios característico e mínimo de cada uma das matrizes dadas. 
2 5000 4 -1 0 0 0 32000 
02000 1 2000 14 0 0 0 
(a) 4=|0 0 4 2 0], b) B=|0 03 10), (0) C=|0 03 100 
003 50 0 003 1 00130 
0 0 0 0 7 O 00 0 3 00004 
1 1 0 2 0 0 
9.63 Sejam A= |0 2 0| e B=|0 2 2 | Mostre que A e B têm polinômios característicos diferentes (portan- 
0 0 1 0 0 1 
to, não são semelhantes) mas têm o mesmo polinômio mínimo. Assim, matrizes não semelhantes podem ter o mesmo 
polinômio mínimo. 
9.64 Seja A uma matriz quadrada de ordem n tal que A* = 0, para algum k > n. Mostre que A” = 0. 
9.65 Mostre que uma matriz A e sua transposta A” têm o mesmo polinômio mínimo. 
9.66 Suponha que f(t) seja um polinômio mônico irredutível tal que f(A) = O para alguma matriz A. Mostre que f(t) é o poli- 
nômio mínimo de 4. 
9.67 Mostre que A é uma matriz escalar kI se, e só se, o polinômio mínimo de A é m(t) = t — k. 
9.68 Encontre uma matriz A cujo polinômio mínimo seja (a) PSr btt 8, (b) PSP MATAS. 
9.69 Sejam f(t) e g(t) polinômios mônicos (coeficiente dominante 1) de grau mínimo para os quais A é uma raiz. Mostre que 


Jt) = g(t). [Assim, o polinômio mínimo de A é único.] 


Respostas dos Problemas Complementares 


Notação: M = [R;; R; ...| denota uma matriz de linhas R,, R,, ... 
9.38 f(A)=[-26,-3; 5,-27,  g(A)=[-40,39; —65,-27, 
f(B)=[3,6; 0,9],  g(B)=2,12; 0,15] 


9.39 42 =[1,4; 0,1) 4=[1,6; 0,1, A4"=[1,2n; 0,1, A4l=[,-2; 


9.40 Seja A = [2,a,b; 0,2,c; 0,0,2]. Tomamos B = 4e, então, a = 1, b = — t}, c = 1. 


0,1] 


9.45 


9.46 


9.47 


9.48 


9.49 


9.50 


9.51 


9.52 


9.57 


9.58 


9.59 


9.60 


9.61 


9.62 


9.68 


9.69 
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(a) 2 +t-1I, (b) +2t+13, (o) É-7+6-l 


() 2=Lu=(3,1); 4=-4,0=(1,2), Œ) 1=4u=(2,1), 
A=-1 


(0) 4=-—1,u = (2,1); À= —5,v = (2,3). Somente A e C podem ser diagonalizadas; usamos P = [u, v]. 
(0) A=1u=(1,1); 4=4,0=(1,-2), 

©) P= [u,v], 

(co) F(A)=[3,1; 2,1), A8 = [21 846, -21 845; —43 690,43 691], 

O B=[-k HI] 


@ åi=1,u=(3,-2); 4=2v=(-1),(6) P= [u4], 
(O) HA)=[,-6; 2,9], A8 = [1021,1530; —510,—764], 
(d) B=[|-3+4V2, -6+6V2; 2-2V2, 4-3v2] 


(a) 4=-2,u=(1,1,0),0 

(b) 4=2,u = (1,1,0); å 

(c) 4=3,u = (1,1,0), v = 
P = [u, v, w]. 


= (1,0,—1);å = 4,w = (1,1,2), 
= —4,v = (0,1,1), 
(1,0,1); 4=1,w=(2,-1,1). Somente A e C podem ser diagonalizadas; usamos 


(a) 4=2,u=(3,-1); A=6,v= (1,1), (b) Não tem autovalores reais. 


Precisamos [-tr(A)]? — 4[det(4)] > 0 ou (a — d}? + 4bc > 0. 


A=[L1; 0,1] 

(a) P=[,-1; 1,2]/V5, D=[7,0; 0,3), 
(b) P=[1,1; 1, —1]/v2, D = [3,0; 0,5], 
(o) P=[,-1; 1,3]///10,  D=[8,0; 0,2] 
(a) 2=-1, u=(1,-1,0), v=(1, 


1 ; 
©) 4=1, u=(21,-1), v=(2,-3,1); 4=22, w=(1, 


Normalizamos u, v, w, obtendo à, ô, Ŵ e tomamos P = [à, ô, ŵ]. (Observação: u e v não são únicos.) 


(a) x= (4s + t)/ v17, y= (-s +4ġ/v17, q(s,t) = 582 — 122, 
(b) x= (3s — t)/v10, y = (s + 3t) / v10, a(s) = +12 


(0) x= (3s+2t)/vV13, y=r, z=(28-3)/V13,  q(r,s,t) =3P +99 — 4, 
b) x=5Ks+Lt, y=Jr+2Ks-2Lt, z=2Jr-— Ks- Lt onde J = 1/vV5, K = 1/v30, 
L= 1/v6; q(r,s,t) = 2r? +25? + 8P 


(a) 4=1[5,-3; -3,5], B=1B,-1; —1,3], 
6) 4=1[14,-2; 2,11], B=1[V2+4V3,2V2- 2,3; 2/2 - 23,424 3] 


@ M)=m)=(1-2/(1-6), O) AD)=(1-2/(1-6), m(t) = (t- 2) - 6) 


(a) AA =t- mA) = (t= 2t- 7), 
O A=- m 
© AH = (t-27 (t-4P -5 


Tomamos a matriz companheira A [Exemplo 9.12(b)] com última coluna: (a) [—8, —6, 5J", (b) [-4,-7,2, 5] 


Sugestão: A é uma raiz de h(t) = Kt) — g(t) e A(t) = 0 ou o grau de A(t) é menor do que o grau de f(A). 


Capítulo 10 


Formas Canônicas 


10.1 INTRODUÇÃO 


Seja T um operador linear de um espaço vetorial de dimensão finita. Vimos no Capítulo 6 que T pode não ter uma 
representação matricial diagonal. Mesmo assim, ainda é possível “simplificar” a representação matricial de T de 
várias maneiras. É esse o principal assunto deste capítulo. Em particular, obteremos o teorema da decomposição 
primária e as formas canônicas triangulares, de Jordan e racional. 

Observamos que as formas canônicas triangulares e de Jordan existem para um operador T se, e só se, o poli- 
nômio característico A(t) de T possuir todas as suas raízes no corpo base K. Isso sempre ocorre se K for o corpo dos 
complexos C, mas pode não ser verdade se K for o corpo dos reais R. 

Neste capítulo também introduzimos a ideia de espaço quociente, uma ferramenta muito poderosa que será 
utilizada na demonstração da existência das formas canônicas triangular e racional. 


10.2 FORMA TRIANGULAR 


Seja Tum operador linear de um espaço vetorial V de dimensão n. Suponha que T possa ser representado pela ma- 
triz triangular 


1 di2 .-.- Ain 
a rew a 

A= 22 2n 
a 


nn 
Então o polinômio característico A(t ) de T é um produto de fatores lineares, a saber, 
A(t) = det(t — A) = (t — a11) (t — axo): (t — ann) 
A recíproca também é verdadeira e constitui um teorema importante (demonstrado no Problema 10.28). 


Teorema 10.1 SejaT:V — V um operador linear cujo polinômio característico fatora em polinômios lineares. 
Então existe uma base de V na qual T é representado por uma matriz triangular. 


Teorema 10.1 (Forma Alternativa) Seja A uma matriz quadrada cujo polinômio característico fatora em polinô- 
mios lineares. Então A é semelhante a uma matriz triangular, ou seja, existe uma matriz invertível P tal que P-!AP 
é triangular. 


Dizemos que um operador linear T pode ser trazido à forma triangular se T puder ser representado por alguma 
matriz triangular. Observe que, nesse caso, os autovalores de T são exatamente os elementos que aparecem na dia- 
gonal principal. Vejamos uma aplicação dessa observação. 


Exemplo 10.1 Seja A uma matriz quadrada sobre o corpo dos complexos C. Suponha que 2 seja um autovalor de 
A”. Mostre que v2 ou — V4 é um autovalor de A. 
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Pelo Teorema 10.1, A e A? são semelhantes, respectivamente, a matrizes triangulares no formato 


* * 
Hi un * ai 
* 2 * 
B= H2 e B2 = Us 
2 
Hn Un 
Como matrizes semelhantes possuem os mesmos autovalores, 4 = é para algum i. Assim, u; = V2 ou; = -V4 é 


um autovalor de A. 


10.3 INVARIÂNCIA 


Seja T:V — V um operador linear. Dizemos que um subespaço W de V é invariante por T ou, então, T-invariante 
se T levar W em si mesmo, ou seja, se v € W implicar T(v) € W. Nesse caso, a restrição de T a W define um ope- 
rador linear de W, de maneira que T induz um operador linear 7:W — W definido por T(w) = T(w) para cada 
weW. 


Exemplo 10.2 


(a) Seja T:R? — R° o operador linear que gira cada vetor v horizontalmente em torno do eixo z por um ângulo 8 
(ver Figura 10-1), definido por 


T(x,y,2) = (xcos0 — ysenð, xsenð +ycos0, z) 


Figura 10-1 


Observe que cada vetor w = (a, b, 0) do plano xy, denotado por W, permanece em W aplicando T. Logo, W é 
T-invariante. Observe também que o eixo z, denotado por U, é invariante por T. Além disso, a restrição de T a 
W é uma rotação em torno da origem O, ao passo que a restrição de Ta U é a transformação identidade de U. 


(b) Os autovetores (não nulos) de um operador linear 7:V — V podem ser caracterizados como geradores de 
subespaços unidimensionais T-invariantes. Suponha que 7(v) = 2v, com v Æ 0. Então W = {kv: k € K}, o subes- 
paço unidimensional gerado por v, é invariante por T, pois 


T(kv) =kT(v) = k(hv) = kiv e W 


Reciprocamente, suponha que dim U = 1, que u £ 0 gere U e que U seja invariante por T. Então T(u) € U e, 
portanto, T(u) é um múltiplo de u, isto é, T(u) = uu. Logo, u é um autovetor de T. 


O teorema seguinte (demonstrado no Problema 10.3) fornece uma classe importante de subespaços invariantes. 


Teorema 10.2 SejamT:V — V um operador linear e f(t) um polinômio. Então o núcleo de f(T) é invariante por T. 
A relação da noção de invariância com as representações matriciais é dada no teorema seguinte (demonstrado 

no Problema 10.5). 

Teorema 10.3 Seja W um subespaço invariante por T:V — V. Então existe uma representação matricial de T com 


uma matriz em blocos É E , sendo A a representação matricial da restrição f deTaw. 
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10.4 DECOMPOSIÇÃO EM SOMAS DIRETAS INVARIANTES 
Dizemos que um espaço vetorial V é a soma direta dos subespaços W,, W,, ..., W,, denotada por 
V-=-meomo...oW, 
se cada vetor v € V puder ser escrito, de maneira única, na forma 
v= w; +w, +... +w, com w; E€ W; 
Vale o teorema seguinte (demonstrado no Problema 10.7). 
Teorema 10.4 Sejam W,, W,, ..., W, subespaços de Ve suponha que 
By = (Win Wo Wim) soeg B, = {W,1 WoW) 


sejam bases de W,, W,, ..., W,, respectivamente. Então V é a soma direta dos W, se, e só se, a união B = B, U... U B, 
é uma base de V. 


Suponha, agora, que T:V — V seja um operador linear e que V seja a soma direta de subespaços (não nulos) 
T-invariantes W,, W,, ..., W,, ou seja, 


V=We..eW e T(W)CW, i=1,...,F 


Denotando a restrição de T a W, por T, dizemos que T é decomponível nos operadores T, ou que T é a soma direta 
dos T, e escrevemos T = T, @ ... ® T,. Também dizemos que os subespaços W,, W,, ..., W, reduzem T ou que 
formam uma decomposição em soma direta T-invariante de V. 

Consideremos o caso especial em que dois subespaços U e W reduzem um operador linear T:V — V; digamos, 
com dim U = 2 e dim W = 3, sendo (u,, u,} e (w,, w,, w;) bases de U e W, respectivamente. Denotando as restri- 
ções de Ta U e W por T, e T,, respectivamente, temos 


(wi) = biwi + biw + bisws 
To(w,) = bawi + bow, + boaws 
To(w3) = bw + bz32w3 + b33w3 


Tu) = aqu + au, 
T (u2) = azu; + asus 


Por isso, as representações matriciais de T,, T,, T são, respectivamente, as matrizes A, B, M dadas por 


bh by by 
A = pa a B=|bp by bol, M = É A 
ana bi; by bas 


De fato, a matriz diagonal em blocos M é a representação de T na base (u,, u,, W,, W, w3} de V (Teorema 10.4), já 
que T(u;) = Ti(u)eT(w;) = To(w;) 
Uma generalização desse argumento fornece o teorema a seguir. 


Teorema 10.5 Seja T:V — V um operador linear e suponha que V seja a soma direta de subespaços T-invarian- 
tes, digamos, W,, W,, ..., W,. Se A; é a representação matricial da restrição de T a W, então T pode ser representado 
pela matriz diagonal em blocos 


M = diag(A,, A», ..., A,) 


10.5 DECOMPOSIÇÃO PRIMÁRIA 


O teorema seguinte mostra que qualquer operador linear T:V — V é decomponível em operadores cujos polinô- 
mios mínimos são potências de polinômios irredutíveis. Esse é o primeiro passo na direção de obter uma forma 
canônica para T. 


EEJ ÁLGEBRA LINEAR 


Teorema 10.6 (Teorema da Decomposição Primária) Seja T:V — V um operador linear com polinômio mínimo 


mE) =A ORO” AA 


em que os f(t) são polinômios mônicos irredutíveis distintos. Então V é a soma direta dos subespaços T-invariantes 
W, W», ..., W,, sendo W, o núcleo de f(T)". Além disso, f(O” é o polinômio mínimo da restrição de T a W.. 

Os polinômios f;(1)" do teorema são primos entre si. Portanto, esse teorema fundamental é uma consequência 
direta (Problema 10.11) dos dois teoremas seguintes (demonstrados nos Problemas 10.9 e 10.10, respectivamente). 


Teorema 10.7 SejamT:V — V um operador linear e f(t) = g(t)h(t) um polinômio tal que AT) = 0, com g(t) e A(t) 
polinômios primos entre si. Então V é a soma direta dos subespaços T-invariantes U = Nuc g(T) e W = Nuc A(T). 


Teorema 10.8 No Teorema 10.7, se f(t) é o polinômio mínimo de T [e g(t) e h(t) são mônicos] então g(t) e A(t) são 
os polinômios mínimos das restrições de Ta U e W, respectivamente. 


O teorema da decomposição primária também é utilizado para apresentar uma caracterização bastante útil dos 
operadores diagonalizáveis (demonstrada no Problema 10.12). 


Teorema 10.9 Um operador linear T:V — V é diagonalizável se, e só se, o polinômio mínimo m(t) de T é um 
produto de polinômios lineares distintos. 


Teorema 10.9 (Forma Alternativa) Uma matriz A é semelhante a uma matriz diagonal se, e só se, o polinômio 
mínimo de A é um produto de polinômios lineares distintos. 


Exemplo 10.3 Seja A 1 uma matriz quadrada tal que A = I. Decida se A é ou não semelhante a uma matriz 
diagonal sobre (i) o corpo real R, (ii) o corpo complexo C. 

Como 4º = I, A é uma raiz do polinômio f (t) = P=l= (t— D(2 +t + 1).0 polinômio mínimo m(t) 
de A não pode ser t — 1, porque 4 + I. Logo, 


m(t)=P+t+1 o m()=2-1 


Como nenhum desses polinômios é um produto de fatores lineares sobre R, A não é diagonalizável sobre R. Por 
outro lado, cada um desses polinômios é um produto de polinômios lineares distintos sobre C. Logo, A é diagona- 
lizável sobre C. 


10.6 OPERADORES NILPOTENTES 


Dizemos que um operador linear T:V — V é nilpotente se T” = 0, para algum inteiro positivo n. Dizemos que o 
índice de nilpotência de Té k se T* = 0, mas Tt! * 0. Analogamente, dizemos que uma matriz quadrada A é nil- 
potente se A” = 0 para algum inteiro positivo n, e de índice k se A* = 0, mas 4H! Æ 0. Claramente, o polinômio 
mínimo de um operador (matriz) nilpotente de índice k é m(t) = f e, por isso, 0 é seu único autovalor. 


Exemplo 10.4 As duas matrizes quadradas de ordem r dadas a seguir são utilizadas em todo este capítulo. 


010... 0 0 À 1 0... 0 0 
001... 0 0 021.. 0 0 
NEN acea e | san 
000... 0 1 0 0 0 A 1 
0 00 0 0 0 0 0 0 2 
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A primeira matriz, denominada bloco de Jordan nilpotente, consiste em entradas iguais a 1 na linha acima da 
diagonal, que denominamos superdiagonal, e O em todas as demais entradas. N = N(r) é uma matriz nilpotente de 
ordem r. (A matriz N(1) de ordem 1 é, simplesmente, a matriz nula [0] de ordem 1.) 

A segunda matriz, denominada bloco de Jordan associado ao autovalor 4, consiste em entradas iguais a 4 na 
diagonal, 1 na superdiagonal e O em todas as demais entradas. Observe que 


JD =H+AN 


De fato, mostraremos que qualquer operador linear T pode ser decomposto em operadores, cada um dos quais é 
uma soma de um operador escalar com um operador nilpotente. 


Um resultado fundamental sobre operadores nilpotentes (demonstrado no Problema 10.16) é o teorema seguinte. 


Teorema 10.10 SejaT:V — V um operador nilpotente de índice k. Então T possui uma representação matricial 
diagonal em blocos em que cada bloco diagonal é um bloco de Jordan nilpotente N. Há, pelo menos, um bloco N 
de ordem k e todos os outros blocos N são de ordens < k. O número de blocos N de cada ordem possível é deter- 
minado, de modo único, pelo operador T. O número total de blocos N de todas as ordens é igual à nulidade de T. 


A demonstração do Teorema 10.10 esclarece que o número de blocos N de ordem i é iguala 2m; — m;,| — Mj-1, 
onde m, é a nulidade de T. 


10.7 FORMA CANÔNICA DE JORDAN 


Um operador linear T pode ser colocado em forma canônica de Jordan se seus polinômios mínimo e característico 
podem ser fatorados em polinômios lineares. Isso sempre vale se K for o corpo dos complexos C. Em geral, sempre 
podemos estender o corpo base K a um corpo no qual os polinômios mínimo e característico podem ser fatorados 
em polinômios lineares; assim, nesse sentido amplo, qualquer operador tem uma forma canônica de Jordan. Ana- 
logamente, toda matriz é semelhante a uma matriz em forma canônica de Jordan. 

O teorema seguinte (demonstrado no Problema 10.18) descreve a forma canônica de Jordan J de um operador 
linear T. 


Teorema 10.11 SejaT:V — V um operador linear cujos polinômios mínimo e característico são, respectiva- 
mente, 


A= G-a- e mA 


e em que os À; são escalares distintos. Então T tem uma representação matricial diagonal em blocos, em que cada 
bloco diagonal é um bloco de Jordan J; = J (,). Para cada 2,,, o bloco J, correspondente tem as propriedades lis- 
tadas a seguir. 


ij? 


(i) Existe pelo menos um J, de ordem m, e todos os outros J, são de ordem < m,. 

(ii) A soma das ordens dos J, é n,. 

(iii) O número de J, é a multiplicidade geométrica de A; 

(iv) O número de J, de cada ordem possível é determinado, de modo único, pelo operador T. 


Exemplo 10.5 Suponha que os polinômios mínimo e característico de um operador linear T sejam, respectiva- 
mente, 


AD)=0-2U—-S) e m=4-2(t-S5) 
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Então a forma canônica de Jordan de T é uma das matrizes diagonais em blocos a seguir. 
5 10 5 10 
diag o I É a 051 ou diig É a 2, g, lo 51 
0 0 5 0 0 5 


Se T tiver dois autovetores independentes associados ao autovalor 2, então a forma canônica de Jordan é a primeira 
matriz; a segunda ocorre se T tiver três autovetores independentes associados a 2. 


10.8 SUBESPAÇOS CÍCLICOS 


Seja T um operador linear de um espaço vetorial V de dimensão finita sobre K. Suponha que v € V, com v Æ 0.0 
conjunto de todos os vetores da forma f(T)v, em que f(t) percorre todos os polinômios sobre K, é um subespaço 
T-invariante de V denominado subespaço T-cíclico de V gerado por v e denotado por Z(v, T). Pelo Problema 10.56, 
poderíamos ter definido, equivalentemente, Z(v, T) como a interseção de todos os subespaços T-invariantes de V 
que contêm v. A restrição de T a Z(v, T) é denotada por Ty. 

Consideremos, agora, a sequência 


v, T(v), Tv), Tw), 


das potências de T agindo sobre v. Seja k o menor inteiro tal que T'(v) é uma combinação linear daqueles vetores 
que o precedem nessa sequência,digamos, 


Po) = -ap o) — ---— aT (v) = agu 
Então 
m,(f) = É + apa +- + at + ao 


é o único polinômio mônico de menor grau tal que m,(T)(v) = O. Dizemos que m(t) é o T-anulador de v e de Z(v, T). 


Vale o teorema seguinte (demonstrado no Problema 10.29), em que usamos a notação que acabamos de introduzir. 


Teorema 10.12 Valem as afirmações seguintes. 
G) O conjunto set {v, T(v),..., TH! (v)} é uma base de Z(v, T), portanto, dim Z(v, T) = k. 
Gi) O polinômio mínimo de Ty é m(t). 


Gii) A representação matricial de T, na base de (i) é a matriz companheira C(m,) de mt), ou 


seja, 
0 0 0 0 —49 
1 0 0 0 —a4 
dme 0 1 0 0 —a, 
0 0 0 O —a; > 
0 0 0 1 =i 


10.9 FORMA CANÔNICA RACIONAL 


Nesta seção apresentamos a forma canônica racional de um operador linear 7:V — V. Enfatizamos que essa forma 
existe sempre, mesmo que o polinômio mínimo não possa ser fatorado em polinômios lineares. (Isso não ocorre 
com a forma canônica de Jordan.) 
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Lema 10.13 SejaT:V — V um operador linear cujo polinômio mínimo é f (t)”, em que ft) é um polinômio mô- 
nico irredutível. Então V é a soma direta 


V=Z(n,7)6---OZ(v,,7T) 
dos subespaços T-cíclicos Z(v,, T) com T-anuladores correspondentes 


ITOS TO”, keda Ho”, n= >m... >n, 


Qualquer outra decomposição de V em subespaços T-cíclicos tem o mesmo número de componentes e o mesmo 
conjunto de T-anuladores. 


Enfatizamos que esse lema (demonstrado no Problema 10.31) não diz que os vetores v, ou outros subespaços 
T-cíclicos Z(v, T) sejam determinados de modo único por T, mas o lema nos diz que o conjunto dos T-anuladores 
é determinado, de modo único, por T. Assim, T tem uma única representação matricial diagonal em blocos 


M = diag(C4, C2,- -, C.) 
em que as C, são matrizes companheiras. De fato, as C, são as matrizes companheiras dos polinômios f(t)”. 


Usando o teorema da decomposição primária e o Lema 10.13, obtemos o resultado a seguir. 


Teorema 10.14 SejaT:V — V um operador linear com polinômio mínimo 


mE) =A ATRO fl” 


em que os f(t) são polinômios mônicos irredutíveis distintos. Então T tem uma única representação matricial dia- 
gonal em blocos 


M = diag(C,,, Cp, e... Cins e.. Cas Co e.. Ca 
em que as C, são matrizes companheiras. Em particular, Cij é a matriz companheira do polinômio fit)", com 
M, =n È ng Èi Nns DES M; = na Z hg Zii 2h, 


A representação matricial de T dada nesse teorema é denominada forma canônica racional. Os polinômios 
hj » . . o 
f;i(t)"” são denominados divisores elementares de T. 


Exemplo 10.6 Seja V um espaço vetorial de dimensão 8 sobre o corpo dos racionais Q, e seja T um operador 
linear de V cujo polinômio mínimo é 


mÀ = AORA? = (É -4P + 6P — 4t —7)(t -3% 


Assim, como dim V = 8, o polinômio característico de T é A(t) = f, (t) f} (t4. Também vemos que a forma canônica 
racional M de T precisa ter um bloco dado pela matriz companheira de f,(t) e um bloco dado pela matriz compa- 
nheira de f(t)”. Temos duas possibilidades. 


(a) diag[C(! -4P +62 —4t-7), C((t-3F), C((t—3))] 
(b) diag[C(! — 48 +62 4-7), C((t—-3)), C(t—3),C(t—3)] 


Ou seja, 
0 0 0 7 0 0 0 7 
: 1 0 0 4 0 —9 0 —9 ; 1 0 0 4 0 9 
0 0 1 4 0 0.1 4 


10.10 ESPAÇO QUOCIENTE 


Sejam V um espaço vetorial sobre um corpo K e W um subespaço de V. Se v é um vetor qualquer de V, escrevemos 
v + W para o conjunto das somas v + w, com w € W; ou seja, 


v+W = {v+4w:wE W} 
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Esses conjuntos são denominados classes laterais de W em V. y vt+W 
Mostramos (Problema 10.22) que essas classes laterais definem 
uma partição de V em subconjuntos dois a dois disjuntos. 


Exemplo 10.7 Seja Wo subespaço de R? definido por 
W=llabja=b) x 


ou seja, W é a reta dada pela equação x — y = 0. Podemos ver 
v + W como uma translação dessa reta obtida com a soma do 
vetor v a cada ponto de W. Conforme indicado na Figura 10-2, a 
classe lateral v + W também é uma reta, e é paralela a W. Assim, Figura 10-2 
as classes laterais de W em R? são precisamente todas as retas 

paralelas a W. 


No teorema seguinte usamos as classes laterais de um subespaço W de um espaço vetorial V para definir um 
novo espaço vetorial, denominado espaço quociente de V por W e denotado por V/W. 


Teorema 10.15 Seja W um subespaço de um espaço vetorial V sobre um corpo K. Então as classes laterais de W 
em V formam um espaço vetorial sobre K com as operações de adição e multiplicação por escalar dadas a seguir. 


G) (u +w) + (v+ W) = (u+ v) +W, GD r(u+ W) =ru +W,comr € K 


Observe que, na demonstração do Teorema 10.15 (Problema 10.24), é necessário mostrar, antes de mais nada, 
que as operações de V/W estão bem definidas, ou seja, sempre que u + W = u! + W ev +W = v + W, temos 


© (u+) +W =(u +V) +W e Gi) ru+W =ru +W,comr EK. 
No caso de um subespaço invariante, temos o seguinte resultado útil (demonstrado no Problema 10.27). 


Teorema 10.16 Seja W um subespaço invariante por um operador linear 7: — V. Então T induz um operador 
linear T de V/W definido por T(v + W) =L (v) + W. Além disso, se T é uma raiz de algum polinômio, então T 
também é. Assim, o polinômio mínimo de T divide o polinômio mínimo de T. 


Problemas Resolvidos 
Subespaços invariantes 


10.1 Seja T:V — V um operador linear. Mostre que cada um dos subespaços dados é invariante por T. 
(a) {0}, (b)V, (c) o núcleo de T, (d) a imagem de T. 
(a) Temos T(0) = 0 € {0}; logo, {0} é invariante por T. 
(b) Paracadav € V , T(v) € V;logo, V é invariante por T. 


(c) Sejau € Nuc T. Então T (u) = 0 € Nuc T, porque o núcleo de T é um subespaço de V. Assim, Nuc T é invariante 
por T. 


(d) Como T(v) € Im T para cada v € V, isso certamente vale quando v € Im T. Logo, a imagem de T é invariante 
por T. 


10.2 Seja (W,) uma coleção de subespaços T-invariantes de um espaço vetorial V. Mostre que a interseção 
W = (1, W; também é T-invariante. 


Se v € W, então v € W; para cada i. Como W, é T-invariante, temos T(v) € W, para cada i. Assim, T(v) € W e, 
portanto, W é T-invariante. 
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10.3 Demonstre o Teorema 10.2. Sejam 7:V — V um operador linear e f(t) um polinômio. Então o núcleo de 
JT) é invariante por T. 


Suponha que v € Nuc f (T), ou seja, que (T)(v) = 0. Devemos mostrar que T(v) também pertence ao núcleo de 
fT), ou seja, que f(T)(T(v)) = (f(T) o T)(v) = 0. Como AAt = tft), temos f(T)o T = T° f(T). Assim, como 
queríamos, resulta 


HO) Tio) = (Pe f(T) = PO) = (0) = 0 


1 -2 
Pelo Problema 10.1, R? e {0} são invariantes por A. Agora, se A tiver algum outro subespaço invariante, deve ser unidi- 
mensional. Contudo, o polinômio característico de A é 


10.4 Encontre todos subespaços invariantes por 4 = | | interpretada como um operador de R°. 


Ag)=ê-t(A)t+|A|=2+1 


Logo, A não tem autovalores (em R) e, portanto, A não tem autovetores. Como os subespaços unidimensionais corres- 
pondem a autovetores [Exemplo 10.2(b)], segue que R? e {0} são os únicos subespaços invariantes por A. 


10.5 Demonstre o Teorema 10.3. Seja Wum subespaço T-invariante. Então existe uma representação matricial de 


. A B ” o o 
T com uma matriz em blocos | 0 C | sendo A a representação matricial da restrição T de Ta W. 
Escolhemos uma base {w}, ..., w,) de W e a estendemos a uma base {w}, . . . , W,, Vj,..., Us + de V. Temos 

Tw)=T(wm)=am+-—+a,w 

T(w) = T(m) = auw: arWr 

T(w,) = T(w,) SAW Te A,rW, 
Tl) = buwi + + biw, + Ct + H Cist 
T(v) = bawi + + by W, + Ca Hi E Casts 
T(v,) = bawi bow, Cava F Cys Us 


Como a matriz de T nessa base é a transposta da matriz de coeficientes desse sistema de equações (Seção 6.2), decorre 


2a A B A ; ; Ee 
que essa matriz é da forma | , sendo A a transposta da matriz de coeficientes do subsistema óbvio. Pelo mesmo 


0 C 


argumento, A é a matriz de fem relação à base (w,) de W. 


10.6 Denote por fa restrição de um operador T a um subespaço T-invariante W. Prove as afirmações dadas. 


(a) Para cada polinômio AA), vale f (T)(w) = f(T)(w). 
(b) O polinômio mínimo de Î divide o polinômio mínimo de T. 
(a) Se ft) = 0 ou se f(t) é uma constante (isto é, de grau 1), o resultado é imediato. 


Suponha que o grau de f(t) seja n > 1 e que o resultado valha para polinômios de grau menor do que n. Seja 


TÀ =u Fana + rata 


Então SD w) = (a f" +a, P! +... +aD(w) 
= (af (Ê(w)) + (ap + + aol) (w) 
= (a„T"™!)(T(w)) + (aa TT +--+ + aol )(w) = f(T) (w) 


(b) Seja m(®) o polinômio mínimo de T. Então, por (a), m(Î)(w) = m(T)(w) = 0(w) = O para cada w € W; ou seja, 
T é um zero do polinômio m(t). Assim, concluímos que o polinômio mínimo de T divide m(t). 
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Decomposições em somas diretas invariantes 


10.7 


10.8 


10.9 


Demonstre o Teorema 10.4. Sejam W,, W,, ..., W, subespaços de V com respectivas bases 
B, = (Wi Wiz- Wim) sew B, = Wa WoW) 
Então V é a soma direta dos W, se, e só se, a união B = U; B; é uma base de V. 
Seja B uma base de V. Então, para cada v € V, 
V= 01W Hee ain de E aaWa teet amn Wm, =W Emt w, 
com w; = ayWi ++: + din, Win, E Wi. Agora mostramos que somas como essa são únicas. Suponha que 


v=wi +w t +w, com weW, 


Como {w 


ilo + + -» Win, } é uma base de W, temos W,, w; = bawi + + Din Win,» e, portanto, 


v = biwi Pereba Wim a bw, + Da Win, 


Como B é uma base de V, temos a, = b,, para cada i e cada j. Logo, w; = wi, e, portanto, a soma de v é única. Em vista 
disso, V é a soma direta dos W, 
Reciprocamente, suponha que V seja a soma direta dos W.. Então, para cada v e V, v = w; ++: + w, onde w; E€ W,. 


Como (wi é uma base de W, cada w, é uma combinação linear dos Wi.» €, portanto, V é uma combinação linear dos 
f ; 
elementos de B. Assim, B gera V. Mostremos que B é linearmente independente. Suponha que 


Wi ee F An Win TT AMA TAN 
Observe que aW; +: + ain, Wim, E Wi. Também temos O = 0 +0- --0 € W,. Como uma soma dessas para O é 
única, 
AnWa + F Ain, Win, =0 para A PR a 


A independência das bases tw; y implica que todos os coeficientes a são nulos. Assim, B é linearmente independente 
e, portanto, uma base de V. 


Seja T:V — V um operador linear e suponha que T = T, & T, em relação a uma decomposição em soma 
direta T-invariante V = U & W. Prove as afirmações dadas. 


(a) m(t) é o mínimo múltiplo comum de m(t) e m,(t), sendo m(t), m(t), m,(t) os polinômios mínimos de T, 
T,, T,, respectivamente. 
(b) A(t) = A (t)A, (t), sendo A(t), A, (£), A>(t) os polinômios característicos de T, T,, T, respectivamente. 
(a) Pelo Problema 10.6, ambos m(t) e m,(t) dividem m(t). Suponha, agora, que f(t) seja um múltiplo de ambos m, (1) e 
mt). Então (TU) = 0eHT,;XW) = 0. Seja v € V, de modo que v = u + w comu € U ew € W. Agora, 
f(T) =f(Tju+f(T)w =f (Tiju +f(T,)w=0+0=0 


Ou seja, T é um zero de f(t). Logo, m(t) divide f(t), de modo que m(t) é o mínimo múltiplo comum de m, (t) e m;(1). 


A 
0 B 


(b) Pelo Teorema 10.5, T tem uma representação matricial M = l | em que 4 e B são as representações 


matriciais de T, e T,, respectivamente. Então, como queríamos, 


U-—A 0 


A(t) = |t — M| = 0 -B 


|= Wr -alar -81 = a (Aale) 


Demonstre o Teorema 10.7. Sejam T:V — V um operador linear e ft) = e()h(t) um polinômio tal que AT) 
= 0, com g(t) e h(t) polinômios primos entre si. Então V é a soma direta dos subespaços T-invariantes U = 
Nuc g(7) e W = Nuc A(T). 


10.10 


10.11 


10.12 
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Inicialmente, observe que U e W são T-invariantes pelo Teorema 10.2. Agora, sendo g(t) e h(t) polinômios primos entre 
si, existem polinômios r(t) e s(t) tais que 


r(A + s(Dh(t) = 1 
Logo, para o operador T, r(T)g(T)+s(T)h(T)=1 (*) 


Seja v € V; então, por (*), v =r(T)ge(T)v + s(T)h(T)v 
Mas a primeira parcela dessa soma pertence a W = Nuc A(T), porque 
h(T)r(T)e(T)v =(Ded(DhT)v=(Df(T)v="(7)0v=0 


Analogamente, a segunda parcela pertence a U. Assim, Vé a soma de U e W. 
Para provar que V = U & W, devemos mostrar que uma soma v = u + w, comu € U ew € W, é determinada de modo 
único por v. Aplicando o operador r(T)g(T) a v = u + w, e usando que g(T)u = 0, obtemos 


r(T)g(T)v = r(T)g(T)u + r(T)g(T)w = r(T)g(T)w 
Também, aplicando (*) unicamente a w e usando que h(T)w = 0, obtemos 
w =r(T)e(T)w + s(T)h(T)w = r(T)e(T)w 


Ambas fórmulas juntas nos dão w = r(T)g(TWw e, portanto, w está determinado de modo único por v. Analogamente, u 
está determinado de modo único por v. Assim, V = U & W, como queríamos mostrar. 


Demonstre o Teorema 10.8. No Teorema 10.7 (Problema 10.9), se f(t) é o polinômio mínimo de T (e g(t) e 
h(t) são mônicos) então g(t) e h(t) são os polinômios mínimos das restrições T, e T, de T a U e W, respecti- 
vamente. 


Sejam m(t) e m,(t) os polinômios mínimos de T, e T,, respectivamente. Observe que g(T,) = 0 e A(T,) = 0, porque U 
= Nuc g(T) e W = Nuc A(T). Assim, 


m(t) divide g(t) e m(t) divide A(t) (1) 


Pelo Problema 10.9, f(t) é o mínimo múltiplo comum de m,(t) e m,(t). No entanto, m,(t) e m,(t) são primos entre si, por- 
que g(t) e h(t) são primos entre si. Em vista disso, f(t) = m,(m(t). Também temos ft) = g(t)h(t). Essas duas equações, 
Junto com (1), e lembrando que todos polinômios envolvidos são mônicos, implicam que g(t) = m;(t) e A(t) = m(t), 
como queríamos mostrar. 


Demonstre o Teorema da Decomposição Primária 10.6. Seja 7:V — V um operador linear com polinômio 
mínimo 


mA) = A(O (DP. fo)” 


em que os f(t) são polinômios mônicos irredutíveis distintos. Então V é a soma direta dos subespaços 
T-invariantes W,, ..., W,, sendo W, o núcleo de f;(T)". Além disso, fi(1)" é o polinômio mínimo da restrição 
de Ta W. 

A prova é por indução em r. O caso r = 1 é trivial. Suponha que o teorema tenha sido provado para r — 1. Pelo Teorema 
10.7, podemos escrever V como a soma direta de subespaços T-invariantes W, e V,, em que W, é o núcleo de fi(T)” e 
V, é o núcleo de (TP ---f(T)” Pelo Teorema 10.8, os polinômios mínimos das restrições de T a W, e V, são fi (O 
e fha (t ---f.(1)”, respectivamente. 

Denotemos a restrição de T a V, por T 1. Pela hipótese de indução, V, é a soma direta de subespaços W,, ..., W, tais que 
W, é o núcleo de fi(T|)" e tais que f/(t)"' é o polinômio mínimo da restrição de Î, a W,. Ocorre que o núcleo de f(T)”, 


com i = 2,.., r, necessariamente está contido em V,, pois f(t)”' divide fa (t)™ ---f.(t)”. Assim, o núcleo de f(T)” 


é igual ao núcleo de f;(T|)";, que é W.. Também, a restrição de T a W, é igual à restrição de Ô a W, (com i = 2, ..., r). 


Logo, f;(t)™ é também o polinômio mínimo da restrição de Ta W. Assim, V = W, $ W, & ---& W, é a decomposição 
procurada de T. 


Demonstre o Teorema 10.9. Um operador linear T:V — V tem uma representação matricial diagonal se, e 
só se, o polinômio mínimo m(t) de T é um produto de polinômios lineares distintos. 


ED ÁLGEBRA LINEAR 


Digamos que m(t) seja um produto de polinômios lineares distintos 


m(t) = (t = u) (t= 22): (t= å,) 
em que os 4; são escalares distintos. Pelo teorema da decomposição primária, V é a soma direta de subespaços W, ..., 
W, em que W; = Nuc (T — 2,1). Assim, se v € W,, então (T — 4,1) (v) = 0, ou T(v) = vu. Em outras palavras, cada 
vetor de W, é um autovetor associado ao autovalor 4;. Pelo Teorema 10.4, a união de bases dos subespaços W, ..., W, é 
uma base de V. Como essa base consiste em autovetores de T, concluímos que T é diagonalizável. 


Reciprocamente, digamos que T seja diagonalizável (isto é, que V tenha uma base consistindo de autovetores de T). 
Sejam ,,...,/,os autovalores distintos de T. Então o operador 


HT) =(T>AIT — AD (T — A) 
leva cada vetor da base em 0. Assim, f(T) = O e, portanto, o polinômio mínimo m(t) de T divide o polinômio 
SO = (t-41 )(t- 22) (td) 


Em vista disso, m(t) é um produto de polinômios lineares distintos. 


Operadores nilpotentes, forma canônica de Jordan 
10.13 Seja T:V — V um operador linear. Suponha que, para v € V, tenhamos T k (v) = O, mas 7%! (v) £ 0. Prove 
as afirmações dadas. 
(a) O conjunto S = {v, T(v),..., T1! (v)} é linearmente independente. 
(b) O subespaço W gerado por S é T-invariante. 
(c) A restrição Í deTaWé nilpotente de índice k. 


(d) Em relação à base (T'-!(v),..., T(v), v} de W, a matriz de T é uma matriz quadrada de ordem k dada 
pelo bloco de Jordan nilpotente N, de índice k. 


(a) Suponha que 
av+aT(v) +a (o) + + ap T% (w) =0 =) 


Aplicando T% ! a (*) e usando T* (v) = 0, obtemos aT*! (v) = 0; e, como T%! (v) Æ 0, também a = 0. Agora, 
aplicando 7-2 a (*) e usando T* (v) = 0 e a = 0, obtemos a, T%! (v) = 0; e, portanto, a, = 0. Em seguida, apli- 
cando T* a (*) e usando T* (v) = 0 e a = a, = 0, obtemos a, T*7! (v) = 0;e, portanto, a, = 0. Continuando esse 
processo, mostramos que todos os a são nulos. Assim, S é independente. 


(b) Sejav € W. Então 
v = bu + biT (v) + Tu) +--+ by T! (v) 
Usando T* (v) = 0, temos 
T(V) = bT (v) +b T? (v) +- + baT (w) EW 
Assim, W é T-invariante. 
(c) Por hipótese, T* (v) = 0. Logo, para i = 0, ..., k — 1, 
P*(T'(v)) = T (v) = 0 


Isso significa que, aplicando T* a cada gerador de W, obtemos 0. Logo, ft = Oe, portanto, fé nilpotente de índice 
k, no máximo. Por outro lado, Î%-! (v) = T4! (v) + 0; ou seja, T é nilpotente de índice exatamente k. 


(d) Com a base {7% (v), T4? (v), ..., T (v), v} de W temos 


tr) = T*(v)= 

HT (0) = O) 

Hr) = Tt(u) 

li E E 
T(v) = T(v) 


Assim, como queríamos mostrar, a matriz de T nessa base é uma matriz quadrada de ordem k dada pelo bloco de 
Jordan nilpotente N,. 
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Seja T:V — V um operador linear e denotemos U = Nuc T e W = Nuc T+ '. Mostre que 
(a) UCcCW bT(W) CU. 


(a) Sejau € U = Nuc T'. Então T'(u) = Oe, portanto, T*!(u) = T(T'(u)) = T(0) = O0.Assim,u € Nuc TH! = W. 
Como isso vale para cada u € U;resultaU C W. 


(b) Analogamente, se w € W =NucT“! então T*!(w) = 0 e, portanto, TH(w) =T(T(w)) = T'(0) = 0. 
Assim, T(W) CU. 


Seja T:V — V um operador linear e denotemos X = Nuc T~ ? Y = Nuc T~ ' e Z = Nuc T.. Pelo Problema 
10.14, temos X C Y C Z. Suponha que 

TERA fujie eyl Ursa Ush {up ... p Upa Ugye Up Wyz Wie} 
sejam bases de X, Y, Z, respectivamente. Mostre que 


S = (us. susT(w),..s T(w)) 
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está contido em Y e é linearmente independente. 
Pelo Problema 10.14, T(Z) C Y, e, portanto, S C Y. Suponha que S seja linearmente dependente. Então existe uma 
relação 

au + + a,u, +bT(w)++bT(w) =0 


em que pelo menos um coeficiente não é nulo. Mais que isso, como (u,) é independente, pelo menos um dos b, deve ser 
não nulo. Transpondo, obtemos 


biT(wy) +- +b,T(w) = -aju — +- — au, € X =Nuc T? 
Logo, T? (bi T(w) +- +b,T(w,))=0 
Assim, Ti! (biw; +---+bw)=0, e, portanto, byw; +--+ b,w, € Y = Nuc Th! 


Como (u,, v} gera Y, obtemos uma relação entre os u,, V, w, em que um dos coeficientes (a saber, um dos b,) não é nulo. 
Isso contradiz o fato de que (u, v, w,) é independente. Assim, S também deve ser independente. 


Demonstre o Teorema 10.10. Seja T:V — V um operador nilpotente de índice k. Então T possui uma represen- 
tação matricial diagonal em blocos consistindo em blocos de Jordan nilpotente N. Há pelo menos um bloco N de 
ordem k e todos os outros blocos N são de ordens <k. O número de blocos N de cada ordem possível é determi- 
nado, de modo único, pelo operador T. O número total de blocos N de todas as ordens é igual à nulidade de T. 
Suponha que dim V = n e denotemos W, = Nuc T, W, = Nuc y. s W, = Nuc r. Denotemos, também, m, = dim W, 
para i = 1, ..., k. Como o índice de T é k, temos W, = V, masW, , £ V e, então,mp | < my = n. Pelo Problema 10.14, 
obtemos 


WmcWC---CW =V 


Assim, por indução, podemos escolher uma base {u}, ..., u„} de V tal que (u,,..., Um, seja uma base de W.. 
Agora escolhemos uma nova base de V em relação à qual T terá a forma procurada. E conveniente denotar os elementos 
dessa nova base usando dois índices. Começamos tomando 


v(1, k) = Um 41 vu(2, k) = Um 42 E vlme — my, k) = Um, 
bem como 

v(L,k— 1) =Tou(1,h), v(2,k— 1) = Tu(2,h), E v(m, — me k— 1) =Toulmp—-mp,Ã) 
Pelo problema precedente, 


Sy = {ut v(l,k — 1),..., v(m — mk 1)} 


Mg—2? 


é um subconjunto linearmente independente de W, _ ,. Estendemos S, a uma base de W, _ ; juntando novos elementos 
(se necessário) que denotamos por 


v(m, — m; +1, k— 1), v(m, — mı +2, k- 1), aloe vma — Mp, k— 1) 
Em seguida, definimos 
v(1,k — 2) = Tu(1,k— 1), v(2,k — 2) = Tu(2,k — 1), mag 
vim — Mg-2;k — 2) = Tu(m,1 — Mm-2,k — 1) 
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Novamente, pelo problema precedente, 
S3 = tur, co Um v(1,k a 2), badi v(m o My-a,h o 2)} 


é um subconjunto linearmente independente de W, _ ,, que pode ser estendido a uma base de W, _ , juntando os ele- 
mentos 


v(m — Mp) + Lk 2), v(m — Meo +2,k-—2), Res SAS ulmp-s — Mg-3,k — 2) 


Continuando dessa forma, obtemos uma nova base de V que, para melhor visualização, arranjamos como segue. 


v(1,k) , u(mg — mph) 

v(1,k — 1), , v(my Mg pk — 1) , v(m; 1 Mk 2k 1) 

v(1,2), cce UM — My1; 2), ces (Mga — Mp2, 2), “os (m, —m,,2) 

v(l, 1), cume — me, 1), sum — Mães, l), ..., v(m — mı, 1), ..,ulmy,1) 


A linha de baixo forma uma base de W,, as duas últimas linhas formam uma base de W,, e assim por diante. No entanto, 
o que é importante é que T leva cada vetor no vetor que está imediatamente abaixo dele nessa tabela, ou no vetor nulo, 
se o vetor estiver na linha de baixo da tabela. Assim, 


ca Juij-l) sej>l 
Toi) = (0 se j=1 


Agora fica claro [ver Problema 10.13(d)] que T tem a forma procurada se os v(i, j) forem ordenados lexicograficamente. 
Começando com v(1, 1), subimos pela primeira coluna até v(1, k), saltamos de volta para v(2, 1) e subimos pela segunda 
coluna até onde der. 

Além disso, haverá exatamente m, — my, entradas diagonais de ordem k. Também haverá 


(mı — m2) — (m; — m) = 2m; — m, — m2 entradas diagonais de ordem k — 1 
2m, — m; — m, entradas diagonais de ordem 2 
2m; — m, entradas diagonais de ordem 1 
como pode ser lido diretamente da tabela. Em particular, como os números m,, ..., m, são determinados de modo único 


por T, o número de entradas diagonais de cada ordem é determinado de modo único por T. Finalmente, a identidade 


m = (m; — me) + Qmpe — me — meo) +: + (2m, — m, — m3) + (2m, — m) 


mostra que a nulidade m, de T é o número total de entradas diagonais de T. 


01101 01100 
0 0 1 1 1 0 0 1 1 1 
Sejam 4 = |0 0 0 0 0O|leB=|0 O O 1 1|.Não é difícil verificar que A e B são nilpo- 
00000 00000 
00000 00000 


tentes de índice 3, isto é, A? = 0, mas 4? Æ 0, e B° = 0, mas B? Æ 0. Encontre as matrizes nilpotentes em 
forma canônica M, e M, semelhantes a A e B, respectivamente. 


Como A e B são nilpotentes de índice 3, M, e M, devem conter um bloco de Jordan nilpotente de ordem 3 e nenhum blo- 
co maior do que 3. Observe que pos(A) = 2 e pos(B) =3, portanto nul(A) = 5 — 2 = 3 enul(B) = 5 — 3 = 2. Assim, 
M, deve ter três blocos diagonais, que devem ser um de ordem 3 e dois de ordem 1, e M, deve ter dois blocos diagonais, 
que devem ser um de ordem 3 e um de ordem 2, como segue. 


3 

II 
soocooo 
Sooon 
soono 
SD oo o 
oscos 

o 

S 

II 
Socos 
Sooon 
soono 
soooo 
ohnooo 
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Demonstre o Teorema 10.11 relativo à forma canônica de Jordan de um operador T. 


Pelo teorema da decomposição primária, T é decomponível em operadores 7,,... T,ouseja, T = T) © <- - @ T,, sendo 
(t — 2;)™ o polinômio mínimo de T.. Assim, em particular, 
(T- AD" =0, ..., (T,— 4D" =0 


Denotemos N; = T, — À,1. Então, para i = 1, ..., r, 


T=N+HAl, com Ny = 0 


m, , 
'60 


Dessa forma, T, é a soma do operador escalar 2,1 com um operador nilpotente N, que tem índice m, pois (t — 4,) 
polinômio mínimo de T, 

Agora, pelo Teorema 10.10, relativo a operadores nilpotentes, podemos escolher uma base de tal forma que N, esteja 
em forma canônica. Nessa base, T; = N; + 4,1 é representado por uma matriz diagonal em blocos M, cujas entradas 
diagonais são as matrizes J,. A soma direta J das matrizes M, está em forma canônica de Jordan e, pelo Teorema 10.5, 
é uma representação matricial de T. 

Finalmente, devemos mostrar que os blocos J satisfazem as propriedades exigidas. A propriedade (i) segue do fato de 
que N, tem índice m,. A propriedade (ii) é válida porque T e J têm o mesmo polinômio característico. A propriedade (iii) 
é válida porque a nulidade de N; = T; — A] é igual à multiplicidade geométrica do autovalor À,. A propriedade (iv) 
decorre do fato de que os T, e, portanto, os N, são determinados de modo único por T. 


Encontre todas as possíveis formas canônicas de Jordan J de um operador linear 7:/ — V com polinômio 
característico A(t) = (t — 2)" e mínimo m(t) = (t — 2)”. 
J deve ser de ordem 5, pois A(t) tem grau 5, e todos elementos diagonais devem ser iguais a 2, que é o único autovalor. 


Como o expoente de t — 2 em m(t) é 2, J deve ter um bloco de Jordan de ordem 2 e os outros devem ser de ordem 2 ou 
1. Assim, há somente duas possibilidades, 


J = diag( |? a É | 21) gü J= diag (|? J 2), 12], 21) 


Encontre todas as possíveis formas canônicas de Jordan de um operador linear T:V — V com polinômio 
característico A(t) = (t — 2)" (t — 5)”. Em cada caso, encontre o polinômio mínimo m(®). 


Como t — 2 tem expoente 3 em A(t), 2, deve aparecer três vezes na diagonal. Analogamente, 5 aparece duas vezes. 
Assim, há seis possibilidades, como segue. 


(o diag a | À J , O dagl? 1 5 61), 
o aff ob m PS) O aaff? 5]. e 6) 6) 
© a(g, p E) [É SD) © deg, e, BI 6) 


O expoente no polinômio mínimo m(t) é igual ao tamanho do maior bloco. Assim, 


(a) m)=(4-2-SP, ©) m)=(4-D4-5), (0) mA =(t-2} 0-57, 
(d m)=(1-2(-5), O m)=0-t-5P, © mA) = (t- 2-5) 


Espaço quociente e forma triangular 
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Seja W um subespaço de um espaço vetorial V. Mostre que as afirmações dadas são equivalentes. 
DuevtW GD)Du-veW (ii) veu+W. 


Suponha que u € v + W. Então existe algum wọ € W tal que u = v + wọ. Logo, u — v = wọ € W. Reciprocamen- 
te, suponha que u — v € W. Então u — v = wọ com wọ E€ W. Logo, u = v + wọ € v + W. Assim, são equivalentes 
(1) e (ii). 

Também temos u — v € W se, e só se, — (u — v) = v — u € W se, e só se, v € u + W. Assim, também são equi- 
valentes (ii) e (iii). 
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Demonstre que as classes laterais de W em V particionam V em conjuntos dois a dois disjuntos, ou seja, 
prove as afirmações seguintes. 


(a) Duas classes laterais u + W e v + W são iguais ou disjuntas. 
(b) Cada v € V pertence a alguma classe, a saber, v € v + W. 
Além disso, u + W = v + W se, e só se, u — v € W, de modo que (v + w) + W = v + W, para cada w € W. 


Seja v € V. Como 0 € W, temos v = v + 0 € v + W, provando (b). 

Suponha, agora, que as classes u + W e v + W não sejam disjuntas, digamos, que o vetor x pertença à classe u + W e 
também à classe v + W. Então u — x € W e x — v € W. Resta provar que u + W = v + W para obter (a). Seja u + wọ 
um elemento da classe lateral u + W. Como u — x, x — v, Wọ pertencem a W, temos 


(u+ wọ) — v= (u= x)+(x—- v) +w EW 


Assim, u + wọ € v + W, e, portanto, a classe lateral u + W está contida na classe lateral v + W. Analogamente, v + W 
está contido em u + W. Assim, u + W = v + W. 

Finalmente, u + W = v + W se, e só se, u € y + W e, pelo Problema 10.21, isso equivale a u — v € W. A última afir- 
mação está demonstrada. 


Seja W o espaço solução da equação homogênea 2x + 3y + 4z = 0. Descreva as classes laterais de W em RÌ. 


W é um plano pela origem O = (0, 0, 0) e as classes laterais de W são os planos paralelos a W. Equivalentemente, as 
classes laterais de W são os conjuntos solução da família de equações 


2x + 3y + 4z = k, keR 
De fato, a classe v + W, com v = (a, b, c), é o conjunto solução da equação linear 
2x+3y+42=2a+3b +40 ou 2(x—-a)+3(y—-b)+4(z-c)=0 
Seja Wum subespaço de um espaço vetorial V. Mostre que as operações dadas no Teorema 10.15 estão bem 
definidas, ou seja, mostre que se u + W =u + W ev + W = v + W, então 


(a) (u+ v) +W = (u+) +W e (b)ru+W =ru +W, com reK 


(a) Como u+ W =u +W e v+W =v +W, tanto u—u quanto v—v pertencem a W. Segue que 
(u + v) — (u + v') = (u — u’) + (v — v') € W e, portanto, (u + v) + W = (w + v') + W. 


(b) Também, como u—u € W implica r(u— u) € W, então ru — ru! =r(u-u)EW e, dessa forma, 
ru+ W = ru + W. 


Sejam V um espaço vetorial e W um subespaço de V. Mostre que a aplicação natural n: V — V/W, definida 
por n(v) = v + W, é linear. 


Dados u, v € V e k € K quaisquer, temos 


n(lu+ v) =u+v+W =u+W+v+W =n(u) +n(v) 
e n(kv) = kv+W = k(v + W) = kn(v) 


Assim, y é linear. 


Seja {w}, ..., w,) uma base de um subespaço W de um espaço vetorial V. Suponha que o conjunto de classes 
laterais (v,,...,U,+, com v = v; + W, seja uma base do espaço quociente V/W. Mostre que o conjunto 


B=(v,,...,U, Wi,- - - , W, } de vetores é uma base de V. Assim, dim V = dim W + dim(V/W). 


Seja u € V. Como (iv) é uma base de V/W, temos 


u=utW=avtawú+-+a 
Logo,u=av+-::+av +w, com w E€ W. Como (w,) é uma base de W, 


u=avw+-c+avtbw + bw, 
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Desse modo, B gera V. 
Mostremos que B é linearmente independente. Suponha que 


Cu He +C + dw+--+dw,=0 (1) 
Então ur +eõã=>0=W 


Como (is; é independente, os c são todos nulos. Substituindo em (1), obtemos dw; + --- + d,w, = 0. Como (w;) é 
independente, os d são todos nulos. Assim, B é linearmente independente e, portanto, uma base de V. 


Demonstre o Teorema 10.16. Seja W um subespaço invariante por um operador linear 7: — V. Então T 
induz um operador linear T de V/W definido por T(v + W) = T(v) + W. Além disso, se T é uma raiz de 
algum polinômio, então T também é. Assim, o polinômio mínimo de T divide o polinômio mínimo de T. 


Começamos mostrando que T está bem definido, isto é, seu + W = v + W, então T(u + W) = T(v + W). Se 
u+ W = v + W, então u — v € W e, como W é T-invariante, T(u — v) = T (u) — T (v) € W. Dessa forma, 


T(u+W=T()+W=T()+W=T(v+W) 


como queríamos mostrar. 
Em seguida, mostramos que T é linear. Temos 


T((u+W)+(v+W))=T(u+v+W)=T(u 
T 


Além disso, 


T(k(u+ W))=T(ru+ W) =T(ru) +W = kKkT(u) +W = k(T(u)+ W) = kT(u+ W) 


Assim, T é linear. 
Finalmente, seja u + W uma classe lateral qualquer de V/W. Temos 


T?(u + W) = T° (u) +W =T(T(u)) +W =T(T(u)+ W) = T(T(u+ W)) = T (u+ W) 
Logo, TP =P. Analogamente, T” = T”, para cada n. Assim, dado um polinômio qualquer 


f(t) =a, + +a A at 


DU + =D +W=D ar) +W =D a(T(u 
=DaT(u+W)=DaT(u+W)=(Daf 


+W 
(u+W)=f(T)(u + W) 
w 
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e, portanto, f(T) = f(T). Dessa forma, se T é uma raiz de f(t), então f(T) = 0 = 
uma raiz de f(t), provando o teorema. 


Demonstre o Teorema 10.1. Seja T:V — V um operador linear cujo polinômio característico fatora em 
polinômios lineares. Então existe uma base de V na qual T é representado por uma matriz triangular. 


A demonstração é por indução na dimensão de V. Se dim V = 1, toda representação matricial de T é uma matrizl x 1, 
que é triangular. 
Agora suponha que dim V = n > 1 e que o teorema seja válido para espaços de dimensões menores do que n. Como o 
polinômio característico de T fatora em polinômios lineares, T tem, pelo menos, um autovalor e, portanto, pelo menos 
um autovetor v não nulo, digamos que T(v) = aj; v. Seja W o subespaço unidimensional gerado por v e denotemos 
PV = V/W. Então (Problema 10.26) dim V = dim V — dim W = n — 1. Observe, também, que W é invariante por T. 
Pelo Teorema 10.16, T induz um operador linear T de V cujo polinômio mínimo divide o polinômio mínimo de T. Como 
o polinômio característico de T é um produto de polinômios lineares, o mesmo ocorre com seu polinômio mínimo e, 
portanto, com os polinômios mínimo e característico de T. Assim, V e T satisfazem as hipóteses do teorema. Logo, por 
indução, existe uma base {0,, . . . , U, de V tal que 

T(m,) = apt 

T(0) = a330, + a330 
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Sejam, agora, v,, ..., v, elementos de V que pertencem às classes laterais v,,..., V,, respectivamente, Então (v,, ..., U} 
é uma base de V (Problema 10.26). Como T(7,) = a220, temos 

T(0) -apõo =0, eportanto, T(v,)— anv, € W 
Mas W é gerado por v, portanto, T(v,) — av, é um múltiplo de v, digamos, 


T(v,)) — amv; = av, e portanto, T(v,) = a,v + av, 


Analogamente para i = 3, ...,n, 


T(v)-apvy— ag —-—av; EW, e, portanto, T(v)=anvtaçgw + + ayti 


Assim, 


e, dessa forma, nessa base, a matriz de T é triangular. 


Subespaços cíclicos, forma canônica racional 


10.29 


10.30 


Demonstre o Teorema 10.12. Sejam Z(v, T) um subespaço T-cíclico, T, a restrição de T a Z(v, T), e 
mt) = E + apt! +--- + aço T-anulador de v. Valem as afirmações seguintes. 


© O conjunto {v, T(v),..., T! (v)} é uma base de Z(v, T), portanto, dim Z(v, T) = k. 
(11) O polinômio mínimo de T, é m(t). 


(111) A representação matricial de T, na base de (i) é a matriz companheira C = C(m,) de m(t) [que tem 
entradas iguais a 1 na subdiagonal, o simétrico dos coeficientes ag, a,, ..., A, | de m(t) na última 
coluna, e entradas nulas no resto]. 


(1) Por definição de m,(t), o vetor Tv) é o primeiro da sequência v, T(v), Tu)... que é uma combinação linear 
dos vetores que o precedem na sequência. Assim, o conjunto B = (vw, T(v), Tw), a a '(v)) é linearmente 
independente. Resta mostrar que Z(v, T) = ger(B), o espaço gerado por B. Pelo que acabamos dever, T'(v) € ger(B). 
Usamos indução para provar que T'(v) € ger(B), para todo n. Supomos que n > k e que T"” '(v) € ger(B), ou seja, 
que T"-! (v) é uma combinação linear de v, Tv), TW), ..., TT '(v). Então T” (v) = T(T"-! (v)) é uma combinação 
linear de T(v), Tv), Nr Tw). Como Tw) e ger(B), segue que T'(v) e ger(B), para cada n. Consequentemente, 
HKTv) € ger(B) para qualquer polinômio f(t). Assim, Z(v, T) = ger(B) e, portanto, B é uma base, como queríamos 
mostrar. 

(ii) Seja m(t) = t + b,£! +--+ + bo o polinômio mínimo de T,. Como v € Z(v, T), temos 

0 = m(T,) (v) = m(T) (0) = T (v) +b, T! (v) +--+ bov 


v 


Assim, T(v) é uma combinação linear de v, T(v),..., TS! (v), de modo que k < s. Contudo, my(T) = 0 e, 
portanto, m;(T,) = 0. Então m(t) divide m(t), de modo que s < k. Decorre que k = se, portanto, m(t) = m(t). 


(iii) T (v) = T(v) 


T,(T(v)) = T? (v) 
roo a E PIRATA E E RR FE 
T (T4 (v)) = T*(v) = —QqU — aT(v) = aT? (v) EENET ap T% (v) 


Por definição, a matriz de T, nessa base é a transposta da matriz de coeficientes desse sistema de equações lineares, 
ou seja, é C, como queríamos mostrar. 


Seja T:V — V um operador linear. Seja W um subespaço T-invariante de V e T o operador induzido no 
quociente V/W. Prove as afirmações dadas. 


(a) O T-anulador de v € V divide o polinômio mínimo de T. 


(b) O T-anulador de v E V/W divide o polinômio mínimo de T. 
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(a) O T-anulador de v € V é o polinômio mínimo da restrição de T a Z(v, T), portanto, pelo Problema 10.6, divide o 
polinômio mínimo de T. 


(b) O T-anulador de v € V/W divide o polinômio mínimo de T, que divide o polinômio mínimo de T pelo Teorema 
10.16. 


OBSERVAÇÃO Se o polinômio mínimo de T é KA", com f(t) um polinômio mônico irredutível, então o T-anula- 
dor dev € Ve o T-anulador det e V/W são da forma f(t)”, comm < n. 


10.31 Demonstre o Lema 10.13. Seja T:V — V um operador linear cujo polinômio mínimo é f (t)”, em que f(t) é 
um polinômio mônico irredutível. Então V é a soma direta de subespaços T-cíclicos Z, = Z(v,, T), em que i 
= 1,..., r, com T-anuladores correspondentes 


FO HO, fA n=mPm>->n, 


Qualquer outra decomposição de V numa soma direta de subespaços T-cíclicos tem o mesmo número de 
componentes e o mesmo conjunto de T-anuladores. 


A prova é por indução na dimensão de V. Se dim V = 1, então V é T-cíclico e vale o lema. Agora suponha que dim V > 
1 e que o lema seja válido para todos os espaços vetoriais de dimensão inferior à de V. 


Como o polinômio mínimo de T é f(t)", existe algum v; € V tal que f(T a (v1) Æ 0; de modo que o T-anulador de 
vu, É (1). Seja Z, = Z(v,, T), sabemos que Z, é T-invariante. Denotemos V = V/Z e seja T o operador linear de V 
induzido por T. Pelo Teorema 10.16, o polinômio mínimo de T divide AA". Logo, a hipótese vale para V e T e, conse- 
quentemente, por indução, V é a soma direta de subespaços T-cíclicos, digamos, 


V=-Z(0,7)6---6Z(0,7) 
em que os T-anuladores correspondentes são f (H)™,...,f()™, n > m >- > np 
Afirmamos que existe um vetor v, na classe lateral v cujo T-anulador é f(t)”, o T-anulador da classe v. Seja w um 


nz 


vetor qualquer de v,. Então f(T)” (w) € Z1. Logo, existe algum polinômio g(t) para o qual 
S(T)” (w) = g(T) (v1) (1) 
Como fA)" é o polinômio mínimo de T, (1) garante que 
0 = f(T)" (w) = f(T)" g(T)(v) 


No entanto, f(t) é o T-anulador de v,, portanto, KA)" divide f(t)” ™ g(t), e, dessa forma, g(t) = f (t) h(t), para algum 
polinômio A(t). Denotamos 


v =w —h(T)(v1) 


Como w — v, = h(T)(v,) € Zi, v, também pertence à classe lateral v. Assim, o T-anulador de v, é um múltiplo do 
T-anulador de v. Por outro lado, por (1), 


S(T” (v2) = f(T)" (w — A(T) (0) =£ (T)? (w) — (MD) (mn) = 0 


Consequentemente, o T-anulador de v, é v, is f(t)”, como afirmamos. 
Analogamente, existem v3,...,U, € V tais que v; € 7; e tais que o T-anulador de v, é f(t)", o T-anulador de 7;. 
Definimos 


Z = Z(v, T), , Z=Zu,7) 


Seja d o grau de f(t), de modo que o grau de f(t)" é dn,. Então, por ser f(t)" o T-anulador de v; e também o T-anulador 
de v;, sabemos que 


TD css) e {0 TT- TO) 


são bases de Z(v, T) e Z(7;, T), respectivamente, para i = 2, ..., r. No entanto, V = Z(%, T) &--- 6 Z(©, T), de modo 
que 


(o, Pey Dem): ces Ure petu) 
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é uma base de V. Portanto, pelo Problema 10.26 e a relação T'(7) = T! (v) (ver Problema 10.27), 
{ui TT 0), Pops TTH o) as Upo, TO 0,)} 


é uma base de V. Assim, pelo Teorema 10.4, V = Z(v,,T) ® --:& Z(v,, T), como queríamos mostrar. 
Resta provar que os expoentes n,, ..., n, são determinados de modo único por T. Como d é o grau de f(t), 


dim V = d(n +- +7n,) e dmZ=dn, E 


Também, se s é um inteiro positivo qualquer, então (Problema 10.59) f (T) (Z;) é um subespaço cíclico gerado por 
S(T)'(v,), que tem dimensão d(n, — s) se n, > s e dimensão 0 se n; < s. 

Agora, qualquer vetor v € V pode ser escrito de modo único na forma v = w; + -++ + w,, onde w; € Z,. Logo, qual- 
quer vetor de f (T) (V) pode ser escrito, de modo único, na forma 


STY (0) =) +: + HT (w,) 
com f(T) (w;) € f(T) (Z;). Seja t o inteiro (que depende de s) para o qual 


n >s, TOE n, >s, ngi ZS 
Então HTM =HM 2) O ef (TY (Z) 
e, portanto, dim| f(T (W=di(m = s) +--+ (n, — s)| (2) 


Os números à esquerda de (2) são determinado de modo único por T. Tomando s = n — 1, (2) determina o número de n; 
que são iguais a n. Em seguida, tomando s = n — 2, (2) determina o número de n, (se existirem) que são iguais an — 1. 
Repetimos esse processo até tomar s = 0 e determinar o número de n, que são iguais a 1. Assim, os n, são determinados, 
de modo único por T e V, terminando a demonstração do lema. 


10.32 Sejam V um espaço vetorial de dimensão sete sobre R e T:V — V um operador linear de polinômio mínimo 
m(t) = (Ê — 2t + 5)(t — 3)”. Encontre todas as formas canônicas racionais M possíveis de T. 
Como dim V = 7, só há duas possibilidades para o polinômio característico de T, A (t) = (? — 2t + 5)? 
(t= 3)? ou A(t) = (É — 2t + 5)(t — 3)°. Além disso, a soma das ordens das matrizes companheiras deve 
totalizar 7. Também uma matriz companheira deve ser C(t? — 2t + 5) e uma outra deve ser C((t — 3)°) = 
C(P — 982 + 27t — 27). Assim, M deve ser uma das três matrizes diagonais em bloco a seguir. 
E a 0 0 27 
(a) diag i : i E! 1 0 -27||, 
E a 01 9 
r J 00 27 
(b) diag E: , [1 0 -27|, É gi , 
- 1 01 9 
o s [00 2 
© diag| |, Sb |1 0 27), B] [B] 
E J 01 9 
Projeções 
10.33 Suponha que V = W; D---& W,.A projeção de V sobre o subespaço W, é a aplicação E: V — V definida 


por Ew) = w, se v = w; +: +w, wi E Wi. Mostre que (a) E é um operador linear, (b) E =E. 


(a) Como a soma v = w; +: + w, w; E W é determinada, de modo único, por v, a aplicação E está bem definida. 
Suponha que, dado u € V, tenhamos u = w} +--+ wl, w; € W,. Então 


v+u = (w +w) + + (w +w) e hu=kw + kw, kw,w; +w, €W; 
são as somas únicas correspondentes a v + u e kv. Então, 
E(v +u) =w, +w, = E(v)+E(u) e  E(kv)= kw, + kE(v) 


e, portanto, E é linear. 


10.34 


10.35 
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(b) Temos que 


w, =0++: +0 +w, +0+--++0 
é a única soma correspondente a w, € W, e, portanto, E(w,) = w, Então, para cada v € V, 
E? (v) = E(E(v)) = E(w;) = w = E(v) 


. 2 7 
Assim, E” = E, como queríamos mostrar. 


Suponha que E:V — V seja um operador linear tal que E = E. Mostre que (a) E(u) = u, para cada 
u € Im E (isto é, V = Im E Ọ Nuc E restrição de E à imagem de E é a transformação identidade); (b) V é a 
soma direta da imagem e do núcleo de E, isto é, V = Im E & Nuc E; (c) E é a projeção de V sobre Im E, a 
imagem de E. Assim, pelo problema precedente, um operador linear 7:V — V é uma projeção se, e só se, 
T = T. Essa caracterização de projeção é usada frequentemente como definição. 


(a) Seu € Im E, então existe algum v € V tal que E(v) = u. Segue que 
E(u) = E(E(v)) = E’ (v) = E(v) = u 
(b) Seja v € V. Podemos escrever v no formato v = E(v) + v — Ew). Como E(v) € Im E e, como 
E(v — E(v)) = E(v) — E’ (v) = E(v) - E(v) = 0 


temos v — E(v) € Nuc E. Assim, V = Im E +Nuc E. 
Agora, suponha que w € Im E N Nuc£. Por (a), temos E(w) = w, porque w € Nuc E. Por outro lado, E(w) = 0, já 
que w € Nuc E. Assim, w = 0 e, portanto, Im E N NucE = {0}. Essas duas condições implicam que V é a soma 
direta da imagem e do núcleo de E. 

(c) Sejav € Ve suponha que v = u + w, comu € Im E ew € NucE. Observe que E(u) = u, por (a), e que E(w) = 0, 
porque w € Nuc E. Logo, 


E(v) = E(u + w) = E(u) + E(w) =u+0=u 


Assim, E é a projeção de V sobre a imagem de E. 


Suponha que V = US W e seja T:V — V um operador linear. Mostre que U e W são T-invariantes se, e só 
se, TE = ET, onde E é projeção de V sobre U. 


Observe que E(v) € U, para cada v € V, e que (i) Ew) = v se, e só se, v € U, (ii) E0) = O se, e só se, v € W. 
Suponha que ET = TE. Seja u € U. Como E(u) = u, 


T(u) = T(E(u)) = (TE) (u) = (ET) (u) = E(T (u)) € U 
Logo, U é T-invariante. Seja, agora, w € W. Como E(w) = 0, 
E(T(w)) = (ET)(w) = (TE)(w) = T(E(w)) = T(0) = 0, e, portanto, T(w) € W 


Assim, W também é T-invariante. 
Reciprocamente, sejam U e W subespaços T-invariantes. Seja v € V e suponha que v = u + w, comueTeweW. 
Então, T (u) € U e T(w) € W Logo, E(T(u)) = T(u) e E(T(w)) = 0. Assim, 


(ET) (v) = (ET) (u + w) = (ET) (u) + (ET)(w) = E(T(u)) + E(T(w)) = T(u) 


e (TE)(v) = (TE) (u + w) = T(E(u + w)) = T (u) 


Ou seja, (ET)(v) = (TE)(v), para cada v € V; assim, ET = TE, como queríamos mostrar. 


Problemas Complementares 


Subespaços invariantes 


10.36 


10.37 


Sejam W invariante por T:V — V e f(t) um polinômio. Mostre que W é invariante por f(T). 


Mostre que cada subespaço de V é invariante por 7 e 0, os operadores identidade e nulo, respectivamente. 
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10.38 Seja W invariante por T}: V > V e T): V — V. Prove que W também é invariante por T) + Te T,T;. 
10.39 Seja T:V — V um operador linear. Prove que cada autoespaço E, de T é T-invariante. 


10.40 Seja V um espaço vetorial de dimensão ímpar (maior do que 1) sobre o corpo dos reais R. Mostre que qualquer operador 
linear de V tem algum subespaço invariante além de Ve (0). 


D sd 


10.41 Encontre todos os subespaços invariantes por 4 = |: 5 


| vista como um operador linear de (a) R?, (b) C2. 


10.42 Suponha que dim V = n. Mostre que T:V — V tem uma representação matricial triangular se, e só se, existem subespa- 
ços T-invariantesW, C W, C -+ C W, = V tais que dim W, = k, com k = 1,...,n. 


Somas diretas invariantes 


10.43 Dizemos que os subespaços W,, ..., W, são independentes se w, +- -- + w, = 0, w; € W,, implica que cada w, = 0. Mos- 
tre que ger(W) = W, ® --- @ W, se, e só se, os W, são independentes. [Aqui, ger(W,) denota o espaço gerado pelos W,] 


10.44 Mostre que V=We&-..-eW, se, e só se, (i) V = ger(W,, .... W) e (ii) para cada k = 1, ..., r, vale 
Wa N ger (WS Wi- Wen W,) = {0}- 


10.45 Mostre que ger (W;) = W, &---& W, se, e só se, dim [ger (W;)] = dim W, + --:+ dim W,. 
10.46 Suponha que o polinômio característico de T:V — V seja A(t) = A()" A(t)” ---f.(t)", em que cada f(t) é um polinômio 


mônico irredutível. Seja V = W, &--- & W, a decomposição primária de V em subespaços T-invariantes. Mostre que 
fit)” é o polinômio característico da restrição de T a W.. 


Operadores nilpotentes 


10.47 Sejam T, e T, operadores nilpotentes que comutam, isto é, T, T, = T5T,. Mostre que T, + T, e T,T, também são nilpo- 
tentes. 


10.48 Seja A uma matriz supertriangular, isto é, todas as entradas na diagonal e abaixo da diagonal são nulas. Mostre que A é 
nilpotente. 


10.49 Seja Vo espaço vetorial dos polinômios de grau <7. Mostre que o operador derivada de V é nilpotente de índice n + 1. 


10.50 Mostre que qualquer bloco de Jordan nilpotente N é semelhante à sua transposta N” (que tem entradas iguais a 1 na 
subdiagonal e demais entradas nulas). 


10.51 Mostre que duas matrizes nilpotentes de ordem 3 são semelhantes se, e só se, tiverem o mesmo índice de nilpotência. 


Mostre com um exemplo que a afirmação não é verdadeira para matrizes nilpotentes de ordem 4. 


Forma canônica de Jordan 


10.52 Encontre todas as possíveis formas canônicas de Jordan das matrizes cujos polinômios característico A(t) e mínimo m(t) 
estão dados. 


(a) M)=(1-2(t-3)2, mA =(t- 2P 0-37, 
O) A= 0-7, mA = -T O AA S= -2 mA = -a2 
10.53 Mostre que cada matriz complexa é semelhante à sua transposta. (Sugestão: use a forma canônica de Jordan.) 


10.54 Mostre que são semelhantes todas as matrizes n x n complexas A tais que A” = I, mas 4, £ I, com k <n. 


10.55 Seja A uma matriz complexa com todos os autovalores reais. Mostre que A é semelhante a uma matriz com todas entra- 
das reais. 
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Subespaços cíclicos 


10.56 Seja T:V — V um operador linear de V. Prove que Z(v, T) é a interseção de todos os subespaços T-invariantes de V que 
contêm v. 


10.57 Sejam ft) e g(t) os T-anuladores de u e v, respectivamente. Mostre que se f(t) e g(t) são primos entre si, então f(t)g(t) é 
o T-anulador de u + v. 


10.58 Prove que Z(u, T) = Z(v, T) se, e só se, g(T)(u) = v, para algum polinômio g(t) primo com o polinômio T-anulador de u. 
10.59 Seja W = Z(v, T) e suponha que o T-anulador de v seja f(t)”, em que f(t) é um polinômio mônico irredutível de grau d. 


Mostre que f(T) (W) é o subespaço cíclico gerado por f(T) (v) e que tem dimensão d(n — s) sen > s e dimensão O se 
n<s. 


Forma canônica racional 


10.60 Encontre todas as formas canônicas racionais possíveis para matrizes 6 x 6 sobre R de polinômio mínimo dado. 
(a) m(t) = (È — 2t + 3)(t + 1}, (b) m(t) = (1-2). 


10.61 Seja A uma matriz 4 x 4 de polinômio mínimo m(t) = (? + 1)(? — 3). Encontre a forma canônica racional de A se A é 
uma matriz sobre o corpo dos (a) racionais Q, (b) reais R, (c) complexos C. 


10.62 Encontre a forma canônica racional de um bloco de Jordan de ordem 4 com À na diagonal. 

10.63 Prove que o polinômio característico de um operador 7:V — V é um produto de seus divisores elementares. 

10.64 Prove que são semelhantes duas matrizes 3 x 3 com os mesmos polinômios mínimo e característico. 

10.65 Denote por C(f(t)) a matriz companheira de um polinômio f(t) arbitrário. Mostre que f(t) é o polinômio característico de 
CHA). 

Projeções 

10.66 Suponha que V =W,- ®W,. Seja E, a projeção de V sobre W, Prove que (i) EE,=0, i £j; 
() I=E + +E, 

10.67 Sejam E,, ..., E, operadores lineares de V tais que 

(i) Æ? = E, (ou seja, cada E, é uma projeção); (ii) EE, =0, i #j; (ii) I=E + +E, 

Prove que V = Im £; @ --- O Im £, 


10.68 Seja E: V — V uma projeção (ou seja, E = E). Prove que E tem uma representação matricial da forma É j , em que 
r é o posto de E e I, é a matriz identidade de ordem r. 

10.69 Prove que duas projeções de mesmo posto são semelhantes. (Sugestão: use o resultado do Problema 10.68.) 

10.70 Seja E:V — V uma projeção. Prove 
()1— E é uma projeção e V = ImE&Im (1-E), (ii) Z + Eéinvertível (sel + 1 # 0). 

Espaços quociente 

10.71 Seja W um subespaço de V. Suponha que um conjunto (v, +W, vw +W, ..., u, + W}de classes laterais de V/W seja 


linearmente independente. Mostre que o conjunto (v,, vz, . . . , v,y de vetores de V também é linearmente independente. 


ED ÁLGEBRA LINEAR 


10.72 Seja W um subespaço de V. Suponha que um conjunto {u;, u2, . - - , u„} de vetores de V seja linearmente independente e 
que ger (u;) N W = {0}. Mostre que o conjunto {u; +W, ..., u, + W}de classes laterais de V/W também é linearmen- 
te independente. 


10.73 Suponha que V = U @ W e que {u}, ..., u,) seja uma base de U. Mostre que {u+ W, ..., u, + W} é uma base do espaço 
quociente V/W. (Observe que não se impõe restrição sobre a dimensionalidade de V ou W.) 


10.74 Seja W o espaço solução da equação linear 


axı + aX +++ + ap,Xn = 0, acK 
e seja v = (b,,b,,...,b,) € K”. Prove que a classe lateral v + W de W em K” é o conjunto solução da equação linear 
ax tax + + + apXn = Db, com b=ab;+---+a,b, 


10.75 Seja V o espaço vetorial de polinômios sobre R e W o subespaço dos polinômios divisíveis por t“ (ou seja, da forma 
agtt +a; +---+a, 4t"). Mostre que o espaço quociente V/W tem dimensão 4. 


10.76 Sejam U e Wsubespaços de V tais que W C U C V. Observe que cada classe lateral u + W de W em U também pode ser 
vista como uma classe lateral de W em V, porque u € U implica u € V. Assim, U/W é um subconjunto de V/W. Prove 
que (1) U/W é um subespaço de V/W, (11) dim (V/W) — dim(U/W) = dim(V/U). 


10.77 Sejam U e W subespaços de V. Mostre que as classes laterais de U N W em V podem ser obtidas intersectando cada 
classe lateral de U em V por cada classe lateral de Wem V, ou seja, 


V/(UNW)={(v+ U) NAW +W): v, EV} 


10.78 Seja T:V — V' um operador linear de núcleo We imagem U. Mostre que o espaço quo- v 
ciente V/W é isomorfo a U pela aplicação 0:V/W — U definida por 0(v + W) = T (v). T 
Além disso, mostre que T = ic ĝo y, onde n:V — V/W é a aplicação natural de V em ” | 
V/W (ou seja, n(v) = v+ W) e i:U — V' é a aplicação de inclusão i(u) = u (ou seja, 
i(u) = u). (Ver diagrama.) V/W = U Eoi y’ 


Respostas dos Problemas Complementares 


10.41 (a) R2e {0}, (b) Œ, {0}, W, = ger(2, 1 — 2i), W, = ger(2, 1 + 2i) 


ano (PEREM paa E 
ORE OA hm) (f A m m m) 


(c) Seja M, um bloco de Jordan com À = 2 de ordem k. Então diag(M;, M3, M), diag(M;, M3, M3), 
diag(M;,M,,M,,M,), diag(Ms,M,,M,,M,,M,) 


1 2 1 -2 6 1 4 
(a) diag(A,A, B), diag(A, B, B), diag(4,B, —1,—1); (b) diag(C, C), diag(C, D, 2), diag(C,2,2,2) 


00 8 
10.60 Sejam 4 = |7 E ik | c-| Di | p= E 
01 


1 0 10 
(a) diag(4,B), (b) diag(4,V3,-v3), (c) diag(i, —i, V3, — v3) 


10.61 Sejam 4 = |7 E B=[ T 


10.62 A matriz companheira com última coluna dada por HAS 4%, —622, 4a” 


Funcionais Lineares 
e o Espaço Dual 


11.1 INTRODUÇÃO 


Neste capítulo estudamos as transformações lineares de um espaço vetorial V em seu corpo de escalares K. (Salvo 
menção explícita em contrário, interpretamos K como um espaço vetorial sobre si mesmo.) Naturalmente, todos os 
teoremas e resultados obtidos para transformações arbitrárias de V continuam valendo nesse caso especial. Contu- 
do, tratamos dessas transformações lineares em separado, em virtude de sua importância fundamental e porque a 
relação especial de Vcom K dá origem a novos conceitos e resultados que não se aplicam ao caso geral. 


11.2 FUNCIONAIS LINEARES E O ESPAÇO DUAL 


Seja V um espaço vetorial sobre o corpo K. Uma aplicação &:V — K é denominada funcional linear de V se, para 
quaisquer u, v E€ V ea,b EK, 


plau + bv) = aġ(u) + bo(v) 


Em outras palavras, um funcional linear de V é uma transformação linear de V em K. 


Exemplo 11.1 


(a) Seja ņ%;:K” — K a i-ésima aplicação projeção, isto é, T; (a;, az, . . .a„) = a;. Então 7; é linear e, portanto, um 
funcional linear de K”. 

(b) Seja V o espaço vetorial dos polinômios em ż sobre R. Seja J:V — R o operador integral definido por 
J(p(t)) = h p(t) dt. Sabemos que J é linear e, portanto, um funcional linear de V. 

(c) Seja Vo espaço vetorial das matrizes quadradas de ordem n sobre K. Seja T:V — K a aplicação traço 


T(A) = di + ay +: + am com A= [a;] 


Ou seja, T associa a uma matriz A a soma de suas entradas diagonais. Essa aplicação é linear (Problema 11.24) 
e, portanto, um funcional linear de V. 


Pelo Teorema 5.10, o conjunto dos funcionais lineares de um espaço vetorial V sobre K também é um espaço 
vetorial sobre K com adição e multiplicação por escalar definidas por 


($ + 0)(v) = (v) + o(v) e (ko) (v) = ko (v) 


onde ) e O são funcionais lineares de V e k € K. Esse espaço vetorial é denominado espaço dual de V e é deno- 
tado por V*. 


EU ÁLGEBRA LINEAR 


Exemplo 11.2 Seja V = K" o espaço vetorial das ênuplas de K, que escrevemos como vetores coluna. Então o 
espaço dual V* pode ser identificado com o espaço dos vetores linha. Em particular, qualquer funcional linear 
4 = (a,,...,a,) em V* tem a representação 


F 
o(x1, X2, ... Xn) = [a], a>, e. , apl Diz, X2; - $i Xy =X + AX + tax, 


Historicamente, a expressão formal à direita dessa igualdade era denominada forma linear. 


11.3 BASE DUAL 


Suponha que V seja um espaço vetorial de dimensão n sobre K. Pelo Teorema 5.11, a dimensão do espaço dual V* 
também é n (pois K tem dimensão 1 sobre si mesmo). Na verdade, cada base de V determina uma base de V* como 
segue (ver Problema 11.3 para a demonstração). 


Teorema 11.1 Seja {v,, ..., v,) uma base de V sobre K. Sejam Q4,- - - , Y, E V* os funcionais lineares definidos por 
cc _ Jl sei=j 
Piu) = dy = E se ij 


Então (d,,..., Ọ, } é uma base de V*. 


A base (Q,) desse teorema é denominada base dual de (v,). A fórmula dada na definição da base dual, utilizan- 
do o delta de Kronecker ô;;, 


di(vi) =1, di(v,) =0, di(vs) = O, ses pilva) =0 
Po(vi) = 0, do(s) = 1, do(vs) = 0, ciez P(Y) =0 


Pa (01) = 0, PnC) = 0, es ca (Ui) = 0, PnlUn) =1 


Pelo Teorema 5.2, essas transformações lineares $; são únicas e estão bem definidas. 


é uma maneira abreviada de escrever 


Exemplo 11.3 Considere a base [v, = (2, 1), v, = (3, 1)} de R?. Encontre a base dual (4,, 2}. 
Queremos encontrar os funcionais lineares h; (x,y) = ax + by e (x,y) = cx + dy tais que 
dilvw)=1, dilv) =0, dal) =0, dalw)=1 


Essas quatro condições levam aos dois sistemas de equações lineares a seguir. 


hilo) ana) asas 
pı) = $8,1) =3a+b=0 (02) = $3,1) =3c+d =1 


As soluções são a 1,b=3ec=l1,d 2. Logo, ġi (x,y) = -x + 3y e ġ,(x,y) = x — 2y constituem a base 
dual de (v,, v,). 


Os dois teoremas seguintes (demonstrados nos Problemas 11.4 e 11.5, respectivamente) estabelecem relações 
entre bases e bases duais. 


Teorema 11.2 Sejam (v,,..., v,) uma base de Ve (d,,..., n} a base dual de V*. Valem as afirmações seguintes. 


(1) Dado qualquer vetor u € V, u = ġ; (u)v, + da(u)v, +- + p, (u)v 
(11) Dado qualquer funcional linear o € V*, o =o(v)d, +o(v)d, +: + olun) Pn: 


Teorema 11.3 Sejam {v}, ..., v, } € {W}, .... w,) bases de V e sejam (d,,..., Øn} € {01,-- -, C, } as bases de V* duais 
de (v,) e (w,), respectivamente. Seja P a matriz de mudança de base de (v,) para (w,). Então (P1) é a matriz de 
mudança de base de {¢ġ;} para {0;}. 
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11.4 ESPAÇO BIDUAL 


Repetimos: cada espaço vetorial V tem um espaço dual V*, que consiste em todos os funcionais lineares de V. Assim, 
V* tem um espaço dual V**, denominado espaço bidual de V, que consiste em todos os funcionais lineares de V*. 
Mostremos que cada v € V determina um elemento específico à € V**. Dado qualquer P € V*, definimos 


d(d) = lv) 


Resta mostrar que essa aplicação d:V* — K é linear. Dados quaisquer escalares a,b € K e funcionais lineares 
4,0 € V*, temos 


òla + bo) = (ap + bo)(v) = ap (v) + bo(v) = ad(p) + bêlo) 


Assim, Ê é linear e, portanto, à € V**. Vale o teorema seguinte (demonstrado no Problema 12.7). 


Teorema 11.4 Se V tem dimensão finita, então a aplicação v > % é um isomorfismo de V sobre V**, 


Essa aplicação v > % é denominada aplicação natural de V em V**. Enfatizamos que a aplicação natural 
nunca é sobrejetora se V não for de dimensão finita. No entanto, ela sempre é linear e, mais que isso, injetora. 

Suponha, agora, que V tenha dimensão finita. Pelo Teorema 11.4, a aplicação natural determina um isomorfismo 
entre Ve V**. Salvo menção explícita em contrário, identificamos V com V** por meio desse isomorfismo. Dessa 
forma, consideramos V como o espaço dos funcionais lineares de V* e escreveremos V = V**, Observamos que se 
(b;) for a base de V* que é dual da base (v,) de V, então {v;} é a base de V** = V que é dual da base {o}. 


11.5 ANULADORES 


Seja W um subconjunto (não necessariamente um subespaço) do espaço vetorial V. Dizemos que um funcional li- 
near $ € V* é um anulador de W se p(w) = 0, para cada w € W, ou seja, se P(W) = {0}. O conjunto de todos 
esses funcionais lineares é denotado por Wº e denominado anulador de W. Mostremos que o anulador de W é um 
subespaço de V*. Claramente, 0 € Wº. Sejam, agora, 9,0 € W°. Então, dados quaisquer escalares a,b € K e 
qualquer w € W, temos 


(ap + bo)(w) = aġ(w) + bo(w) = a0 + b0 = 0 


e, portanto, ap + bo € Wº. Assim, W é um subespaço de V*. 
No caso em que W é um subespaço de V, temos a relação seguinte entre W e seu anulador Wº (ver Problema 
11.11 para a demonstração). 


Teorema 11.5 Sejam V um espaço de dimensão finita e W um subespaço de V. Então 
(i) dmW+dimWº=dimV e ()Wº=W 


Aqui, W® = {v € V:f(v) = 0 para cada p € W°} ou, equivalentemente, W% = (Wo, onde interpretamos 
Wº como um subespaço de V pela identificação de V com V**. 


11.6 TRANSPOSTA DE UMA TRANSFORMAÇÃO LINEAR 


Seja T:V — U uma transformação linear qualquer de um espaço vetorial V num espaço vetorial U. Então, dado 
qualquer funcional linear d E€ U*, a composta ġ ° T é uma transformação linear de V em K. 


T 4 
V— UK 


Ou seja, o T € V*. Assim, a correspondência 
p= 6eT 


é uma aplicação de U* em V*, que denotamos por T‘ e denominamos transposta de T. Em outras palavras, 
T':U* — V* é definida por 


ED ÁLceBRa Linear 


Td) =4ºT 
Assim, (T'())(v) = P(T(v)), para cada v € V. 
Teorema 11.6 A aplicação transposta T‘ de T é uma transformação linear. 
Demonstração: Dados quaisquer escalares a,b € K e funcionais lineares À, o € U*, 
T'(ap + bo) = (ab+bo)oT=a(poT)+b(0ºT) =aT'(h) + bT'(0) 


Assim, T é linear, como queríamos demonstrar. 

Enfatizamos que, se T é uma transformação linear de Vem U, então T' é uma transformação linear de U* em 
V*. A nomenclatura “transposta” para a transformação T‘ sem dúvida deriva da afirmação do teorema seguinte 
(demonstrado no Problema 11.16). 


Teorema 11.7 SejamT:V — U uma transformação linear e A a representação matricial de T em relação às 


bases (v,) de Ve (u,) de U. Então a matriz transposta A” é a representação matricial da transformação transposta 
T':U* — V* em relação às bases duais de {u} e {v;}. 


Problemas Resolvidos 


Espaços duais e bases duais 


11.1 Encontre a base {¢ġ1, &>, Q3 que é dual à base de Rê dada. 
msi v = (0,1,—1), v = = 
Os funcionais lineares podem ser escritos da forma 
di(x,),2) = ax + ay + asz, P(x,y, z) = bix + bzy + bz, P3(x, y, z) =cix + 2y + c3Z 


Por definição de base dual, 4;(v;) = Oparai £ j, mas ġ;(v;) = Iparai = j. Obtemos À exigindo h; (v1) = 1, Pi(v,) = 
0, $, (v3) = 0. Isso fornece 


ġı(1,—1,3) =a; — a +30; = 1, di(0,1,-1)= a, — a; = 0, (0,3, —2) = 3a, — 2a; = 0 


Resolvendo o sistema de equações, obtemos a, = 1, a, = 0, a, = 0. Assim, Q; (x, y, Z) = x. 
Obtemos ġ, exigindo %3(v1) = 0, z(u) = 1, @,(v3) = 0. Isso fornece 


p(1,—1,3) = b; — b, + 3b; = 0, (0,1, —1) = b, — b; = 1, (0,3, —2) = 3b, — 2b, = 0 


Resolvendo o sistema de equações, obtemos b, = 7, b, = -2, a, = -3. Assim, Q, (x, y, Z) = 7x — 2y — 3z. 
Obtemos Q; exigindo Ps (v1) = 0, z(u) =0, (v3) = 1. Isso fornece 


Pa(l,-1,3)=c;—-c + 36; = 0, ġ,(0,1,—1) =, — c3 = 0, P3(0,3,-2) = 3c, — 2c; = 1 
Resolvendo o sistema de equações, obtemos c, = -2,c, = 1, c} = 1. Assim, $3 (x, y, Z) = —2x + y + z. 


11.2 Seja V = {a + bt:a,b € R}o espaço vetorial dos polinômios reais de grau < 1. Encontre a base {v,, v, } de 
V que é dual da base {¢;, $, } de V* dada por 


Sejam v, = a + bt e v, = c + dt. Por definição de base dual, 


(v) =1, dl) =0 e (vı) =0, di(v;) =1 


11.3 


11.4 


11.5 


Capítulo 11 e FUNCIONAIS LINEARES E O Espaço DUAL —— CIP 


Assim, 
div an K w) = h (c+dt)dt=c+}d=0 
e 
= f(a + bf) dt =2a+2b=0 = j (c+dt)dt=2c+2d=1 
Resolvendo cada sistema, obtemos a = 2, b= -2 e c = E! d = assim, (uv, = 2 — 2t, v, = —} + t} é a base de 


V que é dual de {ġ;, do). 


Demonstre o Teorema 11.1. Seja fv,, ..., v,} uma base de V sobre K. Sejam Q,,..., 4, E V* os funcionais 
lineares definidos por ;(v;) = O comi Æ j, mas &;(v;) = 1com i = j. Então (d1, - - - , On } é uma base de V*. 
Começamos mostrando que ($,,..., Q, } gera V*. Seja ġ um elemento arbitrário de V* e suponha que 
(v) =k, p(o) =h, reg p(vn) =k, 


Denote o = kih; + ---+ k, Q, Então 
ao(vi) = (kihi + + knpn) (01) = kihi (u) + kpv) + krpa) 
=k- 1l+k-0+-- +k,- 0=k 
Analogamente, para i = 2,...,n, 


ao(v) = (kipi + + krpa) (v) = kipi) ++ div) +o H+ kronu) = ki 


Assim, $(v;) = o(v;), para i = 1, ..., n. Como qe coincidem nos vetores da base, resulta $ = o = kihi +: +k,d,. 


Por isso, (P1,..., b,) gera V*. 
Resta mostrar que (d,,..., 4, ) é linearmente independente. Suponha que 


ahı +a +: +ad,=0 


Aplicando ambos lados no vetor v,, obtemos 


0=0v)=(mad +- +a, p, (v) = ap (v) + apu) + Hap, lo) 
=al+a:0+---+a,:0=a; 


Analogamente, para i = 2,...,n, 


0 = 0(v;) = (ahi + + anpa) (v) = adi(v) Ho H apil) Ho anpali) = a; 


Logo, a; = 0,...,a„ = 0. Assim, (d,,..., À, } é linearmente independente e, portanto, uma base de V*. 
Demonstre o Teorema 11.2. Sejam (v,, ..., v,) uma base de V e (b,,...,b,) à base dual de V*. Dados 
quaisquer u € V eo € VE Du=5>dluv GD o= J oluo, 
Suponha que 
u=aqvtavw+:c+a,v, (1) 
Então 


pilu) = ahi (v) +adi(w)+---+adi(vy)=a-l+a-0+---+a,-0=a 
Analogamente, para i = 2,...,n, 


di(u) = apiu) +o +adi(v)+---+adiv,) = a; 


Logo, ġı (u) = ay, Po(u) = 5,..., Q (u) = a,. Substituindo esses valores em (1), obtemos (i). 
Para provar (ii), aplicamos o funcional g a ambos lados de (1), obtendo 
o(u) = di(u)o(v,) + dalu)o(w) + dalujo(v) 
= o(v)di(u) + o(v,)do(u) + o 1) Pau) 
= (o(v)py +o(w)d, + + ai n)@n) (14) 


Como isso vale para cada u € V, temos o = o(vi)b, + o(w)p, +: + o(v,)P, como queríamos mostrar. 


Demonstre o Teorema 11.3. Sejam (v,) e (w,) bases de Ve sejam (b;) e (o;yas respectivas bases duas 
de V*. Seja P a matriz de mudança de base de (v,) para [w;). Então pet, é a matriz de mudança de base 


de (4; para (0;). 
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Suponha que, para i = 1, ..., n, 
Wi = A U1 + aiU + + Ann e C; = baPi + bohr ++ antn 


Então P = [a,] e Q = [b;]. Queremos provar que O = (P7! J 
Denotemos a i-ésima linha de Q por R, e a j-ésima coluna de P” por C;. Então 


T 
R; = (ba,bp,...,bj) e C= (a;1, Ap, aia sajn) 


Por definição de base dual, 


ci(w) = (bibi + bap ++ binpn) lajit + aav HH aU) 
= baan + bnan +: + binan = R;C; = y 


onde Ò; é o delta de Kronecker. Logo, 


g =|RC]=[8]=1 


y 


Assim, Q = (PT)! = (PT, como queríamos mostrar. 


11.6 Suponha que v € V, com v Æ 0e dim V = n. Mostre que existe ġ € V*tal que A(v) # 0. 


Estendemos {v} a uma base (v, v, ..., v,) de V. Pelo Teorema 5.2, existe uma única transformação linear Q:V — K 
tal queġ(v)=1 e d(v) =0,i=2,...,n.Assim, À tem as propriedades procuradas. 


11.7 Demonstre o Teorema 11.4. Se V tem dimensão finita, então a aplicação v — % é um isomorfismo de V sobre 
Va 
Começamos provando que a aplicação v — ú é linear, ou seja, que dados vetores v,w € V e escalares a, b € K, 
quaisquer, av + bw = aú + bw. Dado qualquer funcional linear É € V*, 


av + bwlb) = (av + bw) = ad(v) + bo(w) = ai(g) + bi(g) = (aù + bW) ($) 


Como av + bw(ġ) = (av + bw)(Q) para cada ġ € V*, temos av + bw = ad + bw. Assim, v > ô é uma transfor- 
mação linear. 
Suponha, agora, que v € V, v Æ 0. Então, pelo Problema 11.6, existe p € V* para o qual Q(v) £ 0. Logo, 
o(4) = (v) # 0e, assim, à Æ 0. Como v Æ 0 implica ĉ Æ 0, a transformação linear v — % é não singular. 
Ocorre que dim V = dim V* = dim V**, já que V tem dimensão finita. Pelo Teorema 5.9, a transformação v > à 
é um isomorfismo de V sobre V**. 


Anuladores 


11.8 Mostre que se & € V* anula um subconjunto S de V, então & anula o espaço gerado ger(S) por S. Assim, 
S’ = [ger(S)]”. 
Seja v € ger(S). Então existem w,,...,w, € S para os quais v = aw; + aw, +- - - +a,w,. Temos 
dv) = a p(w) + mb) +: +ad(w,)=0,0+0,0+---+a,0=0 


Como v é um elemento arbitrário de ger(S), anula ger(S), como queríamos mostrar. 


11.9 Encontre uma base do anulador W° do subespaço W de R gerado por 
vi = (1,2, —3,4) e v, = (0,1,4,—1) 


Pelo Problema 11.8, basta encontrar uma base do conjunto de funcionais lineares q tais que P(v,) = 0e p(m,) = 0, 
sendo $ (x1, X2, X3, X4) = axı + bx, + cx + dx4. Assim, 


d(1,2,-3,4)=a +2b-3c+4d =0 e d(0,1,4,-1)=b+4c-d =0 


O sistema de duas equações nas incógnitas a, b, c, d está em forma escalonada, com variáveis livres c e d. 


(1) Tomando c = 1, d = 0, obtemos a solução a = 11, b 4,c=1,d=0. 


(2) Tomando c = 0, d = 1, obtemos a solução a = 6, b 1,c=0,d=0. 


Os funcionais lineares h; (x;) = 11x; — 4x, + x, e da(x;) = 6x, — x, + x4 formam uma base de W’. 
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11.10 Mostre as afirmações. (a) Dado qualquer subconjunto S de V, S C Sºº. (b) Se S4 C S, então SL Es 


(a) Seja v € S. Então, dado qualquer funcional linear & € S°, (db) = (v) = 0. Logo, à € (sº)º. Assim, pela 
identificação de V com V**, temos v € SO Por isso, S C Sº, 

(b) Seja 4 € S}. Então (v) = 0, para cada v € S,. Mas Sı € S, portanto, œ anula cada elemento de S, (ou seja, 
ġ E SP. Assim, S}? C S9. 


11.11 Demonstre o Teorema 11.5. Sejam V um espaço de dimensão finita e W um subespaço de V. Então 
() dim W + dim W° = dim V, (Gi) W” = W. 


G) Suponha que dim V = n e que W = r < n. Queremos mostrar que dim W° = n — r. Escolhemos uma base (Wiren 
w,} de W e estendemos essa base a uma base de V, digamos, (w,,...,W,, U1; - - - , Un—r }- Considere a base dual 


E EEE 


Por definição de base dual, cada um dos 9ºs dessa base anula cada w, de modo que 0,,...,0,-, E€ Wº.Afirmamos 
que {0;} é uma base de W°. Agora, to fi é parte de uma base de V*, portanto é linearmente independente. 
Em seguida mostramos que tb;) gera W°. Sejao € W°. Pelo Teorema 11.2, 


= o(w)Pr = tens o(w,)b, F o(vw)o E Rd (Up) Tn 
= 09, EA 04, Em o(vi)o E Un -r)On-r 
= o(vi)o; poset O(Vn-r)On-r 


Consequentemente, (0,,...,0,.,) gera Weé, portanto, uma base de Wº. Em vista disso, como queríamos, 
dim Wº=n—r= dim V — dim W. 


(ii) Suponha que dim V = n e que dim W = r. Então dim V* = n e, por (i), dim W° = n — r. Assim, por (i) temos 
dim Wºº = n — (n — r) =r e, portanto, dim W = dim Wºº. Pelo Problema 11.10, W C Wº. Em vista disso, 
W = Wº, 


11.12 Sejam U e W subespaços de V. Prove que (U + W)? = U? n W°. 


Seja ġ € (U + wy. Então q anula U + W e, portanto, em particular, q anula U e, também, W. Logo, p € U? e 
& € Wº, de modo que ġ € U? N W°. Assim, (U + W)? C U? n W°. 

Por outro lado, suponha que o € U? N W°. Então o anula U e, também, W. Se v € U + W, então v = u + w, com 
u € U e w € W. Logo, o(v) = o(u) +o(w) = 0 + 0 = 0. Assim, o anula U + W, ou seja, o € (U + W)’. Em vista 
disso, U? + W? C (U + WY. 

Juntando as duas inclusões, obtemos o resultado procurado. 


OBSERVAÇÃO Observe que não utilizamos argumento dimensional nessa prova, o que significa que o resultado 
vale em espaços de dimensão finita ou infinita. 


Transposta de uma transformação linear 


11.13 Seja ġ o funcional linear de R? definido por $ (x, y) = x — 2y. Para cada um dos operadores lineares T de 
R? dados, calcule (T ($))(x, y). 


(a) T(x, y) = (x,0), ©) Tx, y) = (y, x+y), (© T(x, y) = (2x — 3y, 5x + 2y) 
Por definição, T (db) = 4º T, isto é, (T‘(ġ)) (v) = A(T(v)) para cada v. Logo, 

(a) (T$) (x,7) = (T œ,y)) = $x, 0) =x 

O) (TP) (6,3) = (Tx y)) = p, x+y) =y- 2x +y) = -2x -y 

(0) (TG) (6,7) = A(T(x,)) = A(2x — 3y, 5x + 2y) = (2x — 3y) — 2(5x + 2y) = —8x — 7y 


11.14 Sejam T:V — U uma transformação linear e T':U* — V* sua transposta. Mostre que o núcleo de T é o 
anulador da imagem de T, isto é, Nuc T = (Im TY. 


Seja € Nuc T‘, isto é, T(h) = p° T = 0. Se u € Im T, então u = T(v), para algum v € V. Logo, 
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11.15 


11.16 


plu) = $(T(x)) = ($° T)(v) = 0(v) = 0 


Temos (u) = 0, para cada u € Im T. Logo, $ € (Im T)’ e, assim, Nuc T“ C (Im T)’. 
Por outro lado, seja o € (Im TY’, isto é, o(Im T) = {0} . Então, para cada v € V, 


(T(0)() = (0º T)(v) = o(T(0)) = 0 = 0(0) 


Temos (T'(o))(v) = 0(v), para cada v € V. Logo, T'(o) = 0. Assim, o € Ker T“ e, portanto, (Im T)? C Ker T". 
Juntando as duas inclusões, obtemos o resultado procurado. 


Seja T:V — U uma transformação linear entre os espaços V e U de dimensão finita. Mostre que pos(T) = 
pos(T). 
Digamos que dim V = n, dim U = m e pos(T)= r. Pelo Teorma 11.5, 


dim(Im T)’ = dim u — dim(Im T) = m — pos (T) = m -r 


Pelo Problema 11.4, T = (Im T e Assim, (T*) = m — re, portnto, como queríamos mostrar, 
pos(T) = dim U* -nul(T)=m-—(m—r)=r= pos(T) 
Demonstre o Teorema 11.7. Sejam T:V — U uma transformação linear e A a representação matricial de T 
em relação às bases (v,) de Ve(u,) de U. Então a matriz transposta A’ é a representação matricial da trans- 
formação transposta T':U* — V* em relação às bases duais de (u,Jefv,). 
Digamos que, para j = 1,...,m, 


T(v) = aju + apih ++ aj (1) 


Queremos provar que, para i = 1,...,n, 


T'(o;) =P + ana ++ aAmPm (2) 


em que (0;) e {¢ġ;} são as bases duais de {u;} e (v;), respectivamente. 
Seja v € V dado e suponha que v = kjv + ku, + +++ + kmUm Então, por (1), 
T(v) =hT(v) +k T (v) +- + kT(0,) 
= (am +: + antin) + koldouy + ee + aapt) Eee + km lamit + apni) 
= (kian + kaz ++ km +: + (kiain + kaan + + Klan Un 


=> (kay; + ka + + km Amit; 
= 


Logo, paraj = 1, ..., n, 


(PO) = (TU) = o; Ekia + kaas ++ Enam Jia) 


i=l 
= kay + kray + o + kmanj (3) 
Por ouro lado, para j = 1,...,n, 
(ad + ado +": + amm) (v) = (ad Haypa +: + am Pn) (kiv +ou, +: + km Um) 
= ha; + haj +... + kn Amj (4) 
Como v € V é um vetor arbitrário, (3) e (4) implicam que 
To) = ad + ado ++ amb Ls agi 


que é (2). Assim, o teorema está provado. 
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Problemas Complementares 


Espaços duais e bases duais 
11.17 Encontre (a) p +0, (b) 34, (c) 24 — 50, com q:Rê —> R e c:R? — R definidos por 
(x,y,z) = 2x — 3y +z e a(x, y,Zz) = 4x — 2y + 3z 


11.18 Encontre a base dual de cada uma das bases de Rº dadas. 
(a) {(1,0,0), (0, 1,0), (0,0, 1)} (b) {1 —2,3), (1, =l, 1); (2, —4, 7)} 


11.19 Seja V o espaço vetorial dos polinômios sobre R de grau <2. Sejam ¢ġ;, 2, Ps OS funcionais lineares definidos por 
PO) =[ 10) dt, (FA) =F), p(s) =) 


Aqui, f(t) =a+bt+c EV e f'(t)denota a derivada de f(t). Encontre a base (fi (t), fa(t), J (t)} de V que é dual de 
td) , do; da). 


11.20 Sejam u, v € V tais que ọ(u) = O implica Q(v) = 0, para cada p € V*. Mostre que v = ru, para algum escalar r. 
11.21 Sejam g,o € V* tais que (v) = Oimplicao(v) = 0, para cada v € V. Mostre que o = kọ, para algum escalar k. 


11.22 Seja Vo espaço vetorial dos polinômios sobre K. Dado a € K, defina Q,:V — K por ġ,( f (t)) = f (a). Mostre que 
(a) Q, É linear, (b) se a Æ b, então À, £ Pp. 

11.23 Seja Vo espaço vetorial dos polinômios de grau <2. Sejam a, b,c € K escalares distintos. Sejam Q,, dp, P, OS funcionais 
lineares definidos por ġ,( f (t)) =f (a), pI) =F(b), PF) =f (c). Mostre que LP, bp, Qe} É linearmente inde- 
pendente e encontre a base { f1 (t), J2 (t), f (£) } de V que é dual. 


11.24 Seja V o espaço vetorial das matrizes quadradas de ordem n. Seja T:V — K a aplicação traço, ou seja, a aplicação 
T(A) = ant ay +: + apm COMA = [a,]. Mostre que T é linear. 


11.25 Seja W um subespaço de V. Mostre que, para cada funcional linear ) de W existe um funcional linear o de V tal que 
o(w) = ġ(w), para cada w € W, ou seja, q) é a restrição de o a W. 


11.26 Seja (e,, ...,e,) a base canônica de K”. Mostre que a base dual é {7}, . . . , T, }, em que 7, é a i-ésima projeção de K”, ou 
seja, Z;(d1,...,G,) = Gi. 


11.27 Seja V um espaço vetorial sobre R. Let &,, 4, € V*. Sejam o:V — Re suponha que o(v) = o, (v), (v), definida 


por V*, também pertence a V*. Mostre que ou ġ = 0 ou ġ, = 0. 


Anuladores 

11.28 Seja Wo subespaço de Rº gerado por (1,2, 3,4), (1,3,-2,6), (1,4, 1,8). Encontre uma base do anulador de W. 
11.29 Seja W o subespaço de R? gerado por (1,1,0) e (0,1,1). Encontre uma base do anulador de W. 

11.30 Mostre que, para cada subconjunto S de V, ger(S) = S”, onde ger(S) denota o espaço gerado por S. 

11.31 Sejam U e W subespaços de um espaço V de dimensão finita. Prove que (U N w)’ =U’ +W. 


11.32 Suponha que V = U 9 W. Prove que V? = U? ẹ W”. 


Transposta de uma transformação linear 


11.33 Seja o funcional linear de R? definido por P(x, y) = 3x — 2y. Para cada uma das transformações lineares T:R? —> R? 
dadas, calcule (T'(9)) (x, y, z). 


(a) T,y,z)=(@& +y, y+z) Ob) T(x,y,z)=(x+y+z, 2x—y) 
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11.34 Suponha que T:U > V e T,:V — W sejam lineares. Prove que (T, º EI = eT. 

11.35 Suponha que T:V — U seja linear e que V tenha dimensão finita. Prove que Im T = (Nuc 7). 

11.36 Sejam T:V — U linear e u € U dados. Mostre que ou u € Im T ou existe ġ € V* tal que T'(ġ) = 0e ġ(u) = 1. 
11.37 Seja V de dimensão finita. Mostre que a aplicação T +» T' é um isomorfismo de Hom(V, V) sobre Hom(V*, V*). (Aqui, 


T é qualquer operador linear de V.) 


Problemas variados 


11.38 Seja Vum espaço vetorial sobre R. Definimos o segmento de reta Wu ligando os pontosu, v € V por uv = (tu + (1 — t)v: 
0 <t< 1).Dizemos que um subconjunto S de V é convexo seu, v € S implica uv C S. Dado q € V*, defina 


W+ = {vE V: (v) >0}, W=(veV:d(v)=0), W` =(veV:q(v)<o0) 
Prove que W*, W e W- são convexos. 


11.39 Seja V um espaço vetorial de dimensão finita. Um hiperplano H de V pode ser definido como o núcleo de um funcional 
linear não nulo & de V. Mostre que cada subespaço de V é a interseção de um número finito de hiperplanos de V. 


Respostas dos Problemas Complementares 


11.17 (a) 6x-— 5y + 4z, (b) 6x-— 9y + 23z, (c) —16x + 4y — 13z 


11.18 (a) ¢ġ; =x, dy =y, dy =2; b) i =-3x-— 5y- 2z, ġ, =2x+y, p, =x+2y+z 


11.19 f(A) =3t-if, hA =-it+it, hA =1-3t+ir 


11.22 (b) Seja Kt) = t. Então ġ,( f (t)) = a # b = hp,( f (t)) e, portanto, pa # Pp. 


11.23 E- @+oi+be _ĉÊ-(a+o)t+ac _ P- (a+b)t+ab 
po- e O- a e AO a e] 


11.28 {ġ (x,y,z, t) =5x—-y +z, (x,y,z, t) = 2y — t} 
11.29 Tó(x,y,2) =x—y+2) 


11.33 (a) (T(9))(x,»,2) = 3x +y — 2z, (b) (T(4))(x,7,2) = —x + 5y + 3z 


Formas Bilineares, 
Quadráticas e Hermitianas 


12.1 INTRODUÇÃO 


Neste capítulo generalizamos os conceitos de transformações lineares e funcionais lineares. Especificamente, in- 
troduzimos o conceito de uma forma bilinear. Essas formas bilineares também dão origem às formas quadráticas e 
hermitianas. Embora as formas quadráticas já tenham sido discutidas anteriormente, neste capítulo tratamos dessas 
formas independentemente dos resultados anteriores. 

Embora o corpo K seja arbitrário, mais adiante nos restringiremos aos casos K =R e K = C. Além disso, 


às vezes podemos precisar dividir por 2. Nesses casos, devemos supor que 1 + 1 Æ 0, o que é válido em 
K-Rok =C. 


12.2 FORMAS BILINEARES 

Seja V um espaço vetorial de dimensão finita sobre um corpo K. Uma forma bilinear de V é uma aplicação 
f:V x V — K tal que, dados a,b € K e uj, v; € V quaisquer, 

G) f(au +bu, v) =af(m,v) + bf (u, v), 

(1) f(u, avı + bu) = af (u, v1) + bf (u, v) 


A condição (i) significa que f é linear na primeira variável e a condição (ii) que f é linear na segunda variável. 


Exemplo 12.1 


(a) Seja fo produto escalar de R”, isto é, dados u = (a) e v = (b), 
f(u, v) =u: v= aqb; + aba +-+: + abn 


Então f é uma forma bilinear de R”. (Na verdade, qualquer produto interno sobre um espaço vetorial real V é 
uma forma bilinear de V.) 


(b) Sejam q e o funcionais lineares arbitrários de V. Seja f:V x V — K definida por f(u, v) = A(u)o(v). Então f é 
uma forma bilinear, já que ¢ e o são, ambas, lineares. 

Seja A = [a;] uma matriz quadrada de ordem n qualquer sobre um corpo K. Então A pode ser identificada 
com a forma bilinear F de K” dada a seguir, em que X = [x] e Y = [y] são vetores coluna de variáveis. 


(c 


< 


SX, Y) =X"AY = DO aj XVii = AX + XV H E Annan 
ij 


Essa expressão formal nas variáveis x, e y, é denominada polinômio bilinear correspondente à matriz A. A 
equação (1) (ver adiante) mostra que, num certo sentido, toda forma bilinear é desse tipo. 
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Espaço das formas bilineares 


Seja B(V) o conjunto de todas as formas bilineares de V. B(V) tem uma estrutura de espaço vetorial definindo, para 
quaisquer f,g € B(V)ek € K,f + gekfpor 


(f +8)(u, v) =f (u, v) + g(u, v) e (Kf), v) = kf (u, v) 
Vale o teorema seguinte (demonstrado no Problema 12.4). 
Teorema 12.1 Seja V um espaço vetorial de dimensão n sobre K. Seja ($,,. - - , É, } uma base qualquer do espaço 


dual V*. Então {f : i, j = 1, ..., n} é uma base de B(V), em que f; é definida por f;;(u, v) = ġ;(u)ġ,(v). Em parti- 
cular, dim B(V) = n. 


12.3 FORMAS BILINEARES E MATRIZES 


Sejam fuma forma bilinear de Ve S = (u,, ..., u,) uma base de V. Dados u, v € V, temos 
uU = aju +: + apun e v=bu+-+bu, 
Então 


f(u, v) =f (au eri Apun, bus RU DM) = S a;b; f (u; u) 
ij 


. 2 . 2 
Assim, fé completamente determinada pelos nº valores f(u,, u). 

A matriz A = [a,], em que a, = fu, u;), é denominada representação matricial de fem relação à base S ou, 
simplesmente, a “matriz de fem S”. Essa matriz “representa” f no sentido seguinte; dados u, v € V quaisquer, 


T 
fu, v) = > ab; f (u; u;) = [u]sA[v]s (1) 
ij 
[Como de hábito, [u]; denota o vetor (coluna) de coordenadas de u na base S.] 


Mudança de base, matrizes congruentes 


Agora perguntamos: como se transforma a matriz que representa uma forma bilinear quando escolhemos uma nova 
base? A resposta é dada no teorema seguinte (demonstrado no Problema 12.5). 


Teorema 12.2 Seja P a matriz de mudança de base de uma base S para uma outra base S’. Se A é a representação 
matricial da forma bilinear f em relação à base original S, então B = PT AP é a representação matricial de f em 
relação à nova base S”. 


Esse teorema motiva uma definição. 


DEFINIÇÃO Dizemos que uma matriz B é congruente a uma matriz A (e escrevemos B = 4) se existir uma matriz 
não singular P tal que B = PTAP. 


Assim, o Teorema 12.2 afirma que são congruentes todas as matrizes que representam uma mesma forma bili- 
. A . T -a = . . 
near. Observamos que matrizes congruentes têm o mesmo posto, pois P e P são não singulares; em particular, o 
conceito introduzido a seguir está bem definido. 


DEFINIÇÃO O posto de uma forma bilinear f de V, denotado pos(f), é o posto de qualquer representação matricial 
de f. Dizemos que f é degenerada ou não degenerada dependendo de termos pos(f) < dim V ou pos(f) = dim V, 
respectivamente. 


12.4 FORMAS BILINEARES ALTERNADAS 


Seja fuma forma bilinear de V. Dizemos que fé 
G) alternada se f(v, v) = 0, para cada v € V; 


Gi) antissimétrica se flu, v) = —f(v, u), para quaisquer u, v € V. 
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Agora, suponha que (i) seja verdadeira. Então (ii) também é verdadeira, pois, dados quaisquer u, v € V, temos 


0=f(u+v, u+v)=flu,u)+f(u,v)+f(v,u)+f(v, v) =F(u,0) +f(v,u) 


Por outro lado, suponha que (ii) seja verdadeira e, também, que 1 + 1 Æ 0. Então (i) também é verdadeira, pois, 
dado qualquer v € V, temos f(u, v) = —f(v, u). Em outras palavras, ser alternada e ser antissimétrica são equivalen- 
tes, sel + 1 Æ 0. 

O teorema principal sobre a estrutura das formas bilineares alternadas (demonstrado no Problema 12.23) é 


dado a seguir. 


Teorema 12.3 Seja fuma forma bilinear alternada de V. Então existe uma base de V na qual f é representada por 
uma matriz diagonal em blocos M do tipo 


m= aiag( | 4 T E a! Em E E jo), (o), ~.. ol) 


Além disso, o número de blocos não nulos é determinado de modo único por f [porque é igual à metade do posto de f]. 


Em particular, esse teorema mostra que, necessariamente, toda forma bilinear alternada tem posto par. 


12.5 FORMAS BILINEARES SIMÉTRICAS, FORMAS QUADRÁTICAS 


Nesta seção investigamos os conceitos importantes de formas bilineares simétricas e formas quadráticas e sua re- 
presentação por meio de matrizes simétricas. A única restrição sobre o corpo K é que 1 + 1 0. Na Seção 12.6 nos 
restringimos ao corpo real R, o que fornece resultados especiais importantes. 


Formas bilineares simétricas 


Seja fuma forma bilinear de V. Dizemos que fé simétrica se, dados quaisquer u, v E€ V, temos 


fu, v) = fv, u), 


É fácil mostrar que f é simétrica se, e só se, qualquer representação matricial A de f é uma matriz simétrica. 
O principal resultado para formas bilineares simétricas (demonstrado no Problema 12.10) é dado a seguir. 
(Enfatizamos que estamos supondo 1 + 1 Æ 0.) 


Teorema 12.4 Seja fuma forma bilinear simétrica de V. Então V tem uma base {v}, ..., v,; na qual fé representada 
por uma matriz diagonal, isto é, na qual f(v, v,) = O, sei A). 


Teorema 12.4 (Forma Alternativa) Seja A uma matriz simétrica sobre K. Então A é congruente a uma matriz 
diagonal, ou seja, existe uma matriz não singular P tal que P'AP é diagonal. 


Algoritmo de diagonalização 


Sabemos que uma matriz não singular P é o produto de matrizes elementares (ver Teorema 3.17). Dessa forma, 
uma maneira de obter a forma diagonal D = P'AP é por meio de uma sequência de operações elementares com as 
linhas e essa mesma sequência de operações elementares com as colunas. Aplicadas na matriz identidade T, essa 
mesma sequência de operações elementares fornece P”. Podemos formalizar esse algoritmo como segue. 


Algoritmo 12.1 (Diagonalização por Congruência de uma Matriz Simétrica) É dada uma matriz simétrica 
A = [a;] de ordem n. 


Passo 1 Forme a matriz n x 2n em blocos M = [A,, I], em que A, = A é a metade à esquerda de M e a matriz 
identidade 1 de ordem n é a metade à direita de M. 
Passo 2 Examine a entrada a,,. Há três casos. 
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Caso | a + 0 (Use a,, como um pivô para colocar zeros abaixo de a,, em M e à direita de a, em ,.) Para i = 
PAIRE (A 


(a) Aplique a operação com as linhas “Substituir R, por -a R, + a R. 
(b) Aplique a operação correspondente com as colunas “Substituir C, por -a C, + a C7. 


Essas operações reduzem a matriz M à forma 
a 0 * * 
we | prr () 


Caso ll a, = 0, mas a, + 0, para algum k> 1. 


(a) Aplique a operação com as linhas “Trocar R, e R, entre si”. 
(b) Aplique a operação correspondente com as colunas “Trocar C, e C, entre si”. 


(Essas operações levam a, para a primeira entrada diagonal, que reduz a matriz ao Caso I.) 


Caso Ill Todas entradas diagonais a, = 0, mas algum a, £ 0. 


(a) Aplique a operação com as linhas “Substituir R, por R, + Rj”. 
(b) Aplique a operação correspondente com as colunas “Substituir C, por C, + C”. 


(Essas operações levam 2a, para a i-ésima entrada diagonal, que reduz a matriz ao Caso IL.) 


Assim, finalmente, M é reduzida à forma (*), em que A, é uma matriz simétrica de ordem menor do que a ordem 
de A. 


Passo 3 Repita o Passo 2 com cada nova matriz A, (suprimindo as primeiras linha e coluna da matriz precedente) 
até que A esteja diagonalizada. Então, M está transformada à forma M’ = |D, O], em que D é diagonal. 


Passo 4 Tome P = Q”. Então D = P'AP. 


OBSERVAÇÃO 1 Enfatizamos que, no Passo 2, as operações com as linhas alteram os dois lados de M, mas as 
operações com as colunas alteram apenas o lado esquerdo de M. 


OBSERVAÇÃO 2 A condição 1 + 1 4 0 é utilizada no Caso III, em que concluímos 2a, # O a partir de a; 0. 


No Problema 12.9 apresentamos uma justificativa para esse algoritmo. 


1 2 —3 
Exemplo 12.2 Seja A = 2 5 —4 |. Aplique o Algoritmo 12.1 para encontrar uma matriz não singular P tal 
—3 —4 8 


que D = P'AP seja diagonal. 
Começamos construindo a matriz M = [A, I], isto é, tomamos 


1 2 -3'100 
M=ļ4,]=| 2 5 -40 1 0 
-3 -4 8'001 


Aplicamos nas linhas de M as operações “Substituir R, por -2R, + R,” e “Substituir R, por 3R, + R,” e, depois, 
aplicamos nas colunas de M as operações correspondentes “Substituir C, por -2C, + C,” e “Substituir C, por 3C, 
+ C;”, obtendo 


1 2 -3 1 0 0 1 0 0 1 0 0 
01 21-21 0 e, depois, 0 1 21-21 0 
0 2 113 0 1 0 2 -l1 l 3 0 1 
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Em seguida, aplicamos nas linhas de M a operação “Substituir R, por -2R, + R,” e, depois, aplicamos nas colunas 
de M a operação correspondente “Substituir C, por -2C, + C;”, obtendo 


10 011/00 10 0/1 00 
01 21-—2 1 0 e, depois, 0 1 01-—2 1 0 
00 -5! 7 -2 1 0 0 -5! 7 -2 1 
Assim, A foi diagonalizada. Escrevemos 
| =2 7 1 0 0 
P= 0 1 -2 e, portanto, D=PlA4p=|0 1 0 
0 0 1 0 0 -5 


Enfatizamos que P é a transposta da metade à direita da matriz final. 


Formas quadráticas 
Começamos com uma definição. 


DEFINIÇÃO A Dizemos que uma aplicação q:V — K é uma forma quadrática se g(v) = f(v, v), para alguma 
forma bilinear simétrica f de V. 


Se 1 + 1 Æ 0 em K, então a forma bilinear f pode ser obtida de volta da forma quadrática q usando a forma 
polar de fa seguir. 


f(u, v) = la(u + v) — a(u) — a(v)] 


Seja, agora, f representada por uma matriz simétrica A = [a,] e suponha que 1 + 1 # 0. Escrevendo X = [x] 
para um vetor coluna de variáveis, q pode ser representada na forma 


q(X) =f (X, X) = XT AX = Do jk; = Dai aa fi 
ij i i<j 


Essa expressão formal nas variáveis x; também é denominada forma quadrática. 
A saber, temos a definição alternativa seguinte. 


DEFINIÇÃO B Uma forma quadrática nas variáveis x,, X,, ..., x, é um polinômio tal que cada um de seus termos 
tem grau dois, isto é, 


q(x1, X2, pe Xn) = Lep + > di; 


i i<j 


Usando 1 + 1 Z 0, a forma quadrática q da Definição B determina uma matriz simétrica A = [a,], em que 
Ai = C eaj = aj; = 3d. Assim, as Definições A e B são, essencialmente, iguais. 
Se a representação matricial A de q é diagonal, então q tem a representação diagonal 


q(X) =X AX = axi + ap ++ anã 


Assim, o polinômio quadrático que representa q não tem termos mistos, com duas variáveis distintas. Além disso, 
pelo Teorema 12.4, toda forma quadrática tem alguma representação desse tipo (se 1 + 1 Æ 0). 


12.6 FORMAS BILINEARES SIMÉTRICAS REAIS, LEI DA INÉRCIA 


Nesta seção tratamos de formas bilineares simétricas e formas quadráticas em espaços vetoriais V sobre o corpo 
dos reais R. A natureza especial de R enseja uma teoria independente. O teorema seguinte é o resultado principal 
(demonstrado no Problema 12.14). 


Teorema 12.5 Seja fuma forma bilinear simétrica de V sobre R. Então existe uma base de V na qual fé repre- 
sentada por uma matriz diagonal. Qualquer outra representação matricial diagonal de f tem o mesmo número p de 
entradas positivas e o mesmo número n de entradas negativas. 
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Esse resultado é, às vezes, denominado Lei da Inércia ou Teorema de Sylvester. O posto e a assinatura de uma 
forma bilinear simétrica f são denotados e definidos por 


pos(f) =p +nesigf)=p-n 
Pelo Teorema 12.5, esses valores estão determinados de modo único. 
Dizemos que uma forma bilinear simétrica f é 


G) positiva se q(v) = flv, v) > 0, para cada v Æ 0; 
(ii) não negativa se q(v) = f (v, v) > 0, para cada v. 


Exemplo 12.3 Seja fo produto escalar de R”. Vimos que fé uma forma bilinear simétrica de R”. Observamos que 
f também é positiva. De fato, dado qualquer u = (a;) £ 0 de R”, 


fluu) =4 456 +22 50 


Nas Seções 9.6 e 12.5 vimos como diagonalizar uma forma quadrática real q ou, equivalentemente, uma matriz 
simétrica real A, por meio de uma matriz de transição ortogonal P. Se P for, tão somente, não singular, podemos 
representar q na forma diagonal com todas entradas não nulas iguais a 1 ea —1. De fato, temos o corolário seguinte. 


Corolário 12.6 Qualquer forma quadrática real q tem uma única representação do tipo 


2 2 2 2 
qÈX1, X2; -+ Xn) = X1 For FXp T Xp TTG 


em que r = p + n é o posto da forma q. 


Corolário 12.6 (Forma Alternativa) Qualquer matriz simétrica real A é congruente a uma única matriz diagonal 
D = diag(l,, —l„ 0) 


em que r = p + n é o posto de A. 


12.7 FORMAS HERMITIANAS 


Seja V um espaço vetorial de dimensão finita sobre o corpo dos complexos C. Uma forma hermitiana de V é uma 
aplicação f:V x V — C tal que, dados a,b € C e u;, v E€ V quaisquer 
(1) flau + buz, v) = af (u, v) T bf (u, v), 
Gi) f(u, v) =f (v, u). 
(Como sempre, k denota o complexo conjugado de k € C.) 
Usando (i) e (ii), obtemos 


f(u, avı + bu) =flav, +bv,, u) =af(v,,u) + bf (v, u) 
= af (v, u) + bf (v, u) = af (u, v1) + bf (u, v2) 


Assim, 
Gii) f(u, avı + bv) = af (u, vi) + bf (u, v2). 
Como antes, a condição (i) significa que f é linear na primeira variável. Por outro lado, a condição (iii) significa 
que fé linear conjugada na segunda variável. Além disso, a condição (ii) acarreta f(v, v) = f (v, v) e, portanto, 
fv, v) é real, para cada v € V. 

Os resultados das Seções 12.5 e 12.6 para formas simétricas têm seus análogos para formas hermitianas. As- 
sim, a aplicação q:V — C, definida por g(v) = fv, v) é denominada forma quadrática hermitiana ou forma qua- 
drática complexa associada à forma hermitiana f. Podemos obter f de volta de q usando a forma polar 


f(u, v) = ala(u + v) — glu — v)] +4 lg(u + iv) — a(u — iv)] 
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Seja, agora, S = {u,, ..., u,) uma base de V. A matriz H = [h,] dada por A, = fu, u) é denominada represen- 
tação matricial de f na base S. Por (ii), f (u;, u;) =f (uj, u;), portanto, H é hermitiana e, em particular, as entradas 
diagonais de H são reais. Assim, qualquer representação matricial diagonal de f tem apenas entradas reais. 

O teorema seguinte (demonstrado no Problema 12.47) é o análogo complexo do Teorema 12.5 relativo a for- 
mas bilineares simétricas reais. 


Teorema 12.7 Seja f uma forma hermitiana de V sobre C. Então existe uma base de V na qual f é representada 
por uma matriz diagonal. Qualquer outra representação matricial diagonal de f tem o mesmo número p de entradas 
positivas e o mesmo número n de entradas negativas. 


Novamente, o posto e a assinatura de uma forma hermitiana f são denotados e definidos por 
pos(f) =p +nesis()=p-—n 


Pelo Teorema 12.7, esses valores estão determinados de modo único. 
Analogamente, dizemos que uma forma hermitiana f é 


Gi) positiva se g(v) = flv, v) > 0, para cada v +Æ 0; 
(ii) não negativa se q(v) = f (v, v) > 0, para cada v. 


Exemplo 12.4 Seja f'o produto escalar de C”, ou seja, para quaisquer u = (z) e v = (w;) de C”, 
f(u, v) =u: v = 23W + zW + +22 
Então, f é uma forma hermitiana de C”. Além disso, f também é positiva, pois, dado qualquer u = (z;) £ O de C”, 


f(u, u) = 22, + 2223 + +++ += la + Aeaee PAi > 0 


Problemas Resolvidos 


Formas bilineares 
12.1 Sejam u = (x,,x,, X3) € v = (Yi; Ya Y3). Escreva f em notação matricial, sendo 


Fu, v) = 3x1 — 24473 + 5x21 + 7X2V2 — Bxo)3 + Aa — 6X3V3 


Seja A = [a;], em que a, é o coeficiente de x,y,. Então 


3 0 2] [á 
f(u, v) = XTAY = [xxx] 5 7 -8||» 
0 4 —6 y3 


12.2 Seja A uma matriz n x n sobre K. Mostre que a aplicação f definida por f(X, Y) = X'AY é uma forma bilinear 
de K”. 
Dados 4, b € K e X,, Y, € K” quaisquer, 


f(aX, +bX,, Y) = (aX, + bX5) AY = (aXT + bXDJAY 
= aXTAY + bX AY = af (X, Y) + bf (X,Y) 
Logo, fé linear na primeira variável. Também, 
f(X, aY, +bY,) = XTA(aY, +bY,) = aXTAY, + bXTAY, = af (X, Y1) + bf (X, Y2) 


Logo, fé linear na segunda variável e, portanto, é uma forma bilinear de K”. 
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12.3 Seja fa forma bilinear de R? definida por 
Flax), @1y2)] = 2x171 — 3x4» + Ay» 
(a) Encontre a matriz A de fna base (u, = (1, 0), u, = (1, 1)). 
(b) Encontre a matriz B de f na base (v, = (2, 1), v, = (1,-1)). 


(c) Encontre a matriz de mudança de base P da base (u,) para a base (v,) e verifique que B = P'AP. 


(a) Tomando A = la), com a, = fu, u), obtemos 


4i = FA, 0), (1, 0))=2-0-0=2, 41 =f(1,1), (1,0))=2-0+0=2 
an =f[(1,0), (1,1))=2-3-0=1, an =f|(1,1), (1,1))=2-3+4=3 
Assim, Á = É a (éa maiz de fna base (u,, u}. 


(b) Tomando B = [b;], com bj = fü, v), obtemos 


by =f|(2,1), (2,1) =8-6+4=6, ba =f|(1,=1), (2,1) =4-3-4= -3 
b =f[(2,1), (1,—1)] =4+6-4=6, b» =F(1,-1), (1,-1)]=2+3+4=9 
6 61. ; 
Assim, B = 39 é a matriz de f na base (v,, v,). 
(c) Escrevemos v, e v, em termos deu, e u,, Ou seja, V; = u, + u, € Vv, = 2u, — u,. Então 
-J1 2 r. ll 1 
é a 
Tp. |1 1||2 OI 2) | 6 6| 
e pup=|> au IE EE j= 
12.4 Demonstre o Teorema 12.1. Seja V um ço vetorial de dimensão n sobre K. Seja (b,,..., ),+ uma 
base qualquer do espaço dual V*. Então {f; : = 1, ..., n} é uma base de B(V), em que f, é definida por 


fjlu, v) = di(u)b;(v). Assim, dim B(V) = nº. 

Seja (u, ..., 4,) a base de V dual de {ġ;}. Mostremos que (f;) gera B(V). Seja f € B(V) dado e denotemos 

fu, u;) = a; Afirmamos que f = Di; ai; f Basta mostrar que 

flusu) = E aj fy) (us, U,) com St ch 
Temos 
£ aij fj) (Us, 4) = Xaj y (Us, us) = X azolu us) A ;(u |) = > aijôiçô isOj T Ast = f (Us, us) 
conforme afirmado. Logo, {f;} gera B(V). Agora suponha que Sa; y = 0. Então, para s, t = 1, ..., n quaisquer, 
0 = O(u,, u) = (X aj fy) (us, u) = ass 
A última igualdade segue como na primeira parte. Assim, {f;} é independente, portanto, uma base de B(V). 
12.5 Demonstre o Teorema 12.2. Seja P a matriz de mudança de base de uma base S para uma base S’. Se A é a 


representação matricial da forma bilinear f em relação à base S, então B = P'AP é a representação matricial 
de fem relação à base S”. 


Sejam u, v € V. Como P é a matriz de mudança de base de S para S’, temos P[ulg = [ulse, também, P[vls = [vls, 


de modo que fu]; = [o PT. Assim, 
f(u, v) = [ulçA4lo)s = [ug P”AP[o)s 


= Ls 7 T z : 
Como u e v são elementos arbitrários de V, concluímos que P AP é a matriz de f na base S’. 
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Formas bilineares simétricas, formas quadráticas 


12.6 Encontre a matriz simétrica que corresponde à forma quadrática dada. 


(a) q(x,),2) = 3x? | 4xy y H 8xz 6yz | z, 
(b) g'(x, y, z) = 3x? + xz — 2yz, (c) q" (x,y,z) = 2? — 5%? — 77? 


A matriz simétrica A = [a,] que representa q(x, ..., x,) tem entradas diagonais a, iguais aos coeficientes do termo 
ao quadrado x? e entradas não diagonais a, e a; iguais à metade do coeficiente do termo misto x x,. Assim, 
3 2 4 3 0 5 2 0 0 
(a) 4=|2 -1 3|,(b) 4'=|0 0 Ill) 4º=|0 -5 0 
4-3 1 3-1. 0 0 0 -7 


A terceira matriz 4” é diagonal porque a forma quadrática q” é diagonal, isto é, não tem termos mistos. 


12.6 Encontre a forma quadrática g(X) que corresponde à matriz simétrica dada. 


5 —3 e 4 e za 

(a) A= (b) B=]|-5 -6 SBlilo) C= 
=3 $ E E -1 -6 3 9 
5 8 91 


A forma quadrática 4(X) que corresponde a uma matriz simétrica M é definida por q(X) = X/MX, em que X = [x] 
é o vetor coluna de variáveis. 


(a) Calculando, 


ale) = X7AX = kall 3 | [| =[Sx—3y, —3x4 sil 


= 5x? — 3xy — 3xy + 8y? = 5x? — 6xy + By? 


Conforme esperado, o coeficiente 5 do termo ao quadrado x e o coeficiente 8 do termo ao quadrado y são os ele- 
mentos diagonais de A. O coeficiente —6 do termo misto xy é a soma dos elementos não diagonais —3 e —3 de A (ou, 
o dobro do elemento não diagonal —3, já que A é simétrica). 


(b) Como B é quadrada de ordem 3, temos três variáveis, digamos, x, y, Zz Ou X,, X,, X,. Então, 


q(x, y, Z) = 4x? — 10xy — 6y? + 14xz + 16yz — 97 
ou q(x1,X2,X3) = 4x? — ago — 6x2 + Muy + 16x2x3 — 9x3 


Aqui usamos que os coeficientes dos termos ao quadrado ETEA (oux?, y, z2) são os respectivos elementos 
diagonais 4, —6, -9 de B e que os coeficientes dos termos mistos xx, são a soma dos elementos não diagonais b, e 
b; (ou duas vezes D,, já que b; = D;). 


(c) Como C é quadrada de ordem 4, temos quatro variáveis, digamos, 


db = — TÈ + 3 a BR — 2x123 


+ 10x1x4 a 12x,x3 + 16x5x4 + 18x3x4 


1 —3 2 
12.8 Seja 4 = | —3 7 —5 | . Aplique o Algoritmo 12.1 para encontrar uma matriz não singular P tal que 
2 5 8 


D = P'AP seja diagonal e encontre a assinatura sig(A) de A. 
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12.9 


12.10 


12.11 


Começamos formando a matriz M = [A, I], como segue. 


1 =3 2110 6 
M=A4N=|-3 7 -5,0 1 0 
2 -5 80 0 1 


Usando a,, como pivô, aplicamos as operações “Substituir R, por 3R, + R,” e “Substituir R, por -2R, + R,” com as 
linhas de M e depois aplicamos as operações “Substituir C, por 3C, + C,” e “Substituir C, por -2C, + C} com as 
colunas de 4, obtendo 


1 -3 2) 100 1 001100 
0 —2 1; 3 1 0| eentão |0-21,310 
O 1 41-201 O 1 41-2 01 


Agora aplicamos a operação “Substituir R, por R, + 2R,” e depois aplicamos a operação “Substituir C, por C, + 203”, 
obtendo 


1 0 0 1 0 0 1 0 0 1 0 0 
0 -2 1 3 10 e, então, 0 -2 0 3 1 0 
0 0 9 -1 12 0 0 18 -1 12 


Agora, A foi diagonalizada e a transposta de P está na metade à direita de M. Assim, tomamos 


13 =i 1 0 0 
P=|0 1 1 e, então D=PM4P=I|0 -2 0 
0 0 0 0 18 


Observe que D tem p = 2 elementos diagonais positivos e n = 1 entrada negativa. Assim, a assinatura de A é sig(A) = 
p-n=2=1)541. 


Justifique o Algoritmo 12.1 que diagonaliza (via congruência) uma matriz simétrica 4. 


Considere a matriz em blocos M = [A, 1]. O algoritmo aplica uma sequência de operações elementares com as linhas, 
seguida pela sequência correspondente de operações com as colunas do lado esquerdo de M, que é a matriz A. Isso equi- 
vale a pré-multiplicar A por uma sequência de matrizes elementares, digamos, E,, E,, ..., E,, e pós-multiplicar A pelas 
transpostas de E,. Assim, quando o algoritmo termina, a matriz diagonal D à esquerda de M é igual a 


D=E,---EEAEIEI...ET = QAQ, com Q=E,:-EE, 


Por outro lado, o algoritmo somente aplica as operações elementares com as linhas à matriz identidade 1 do lado direito 
de M. Assim, quando o algoritmo termina, a matriz à direita de M é igual a 


E, BEI = E,- EE, = O 


Tomando P = Q”, obtemos D = P'AP, que é a diagonalização de A via congruência. 


Demonstre o Teorema 12.4. Seja fuma forma bilinear simétrica de V sobre K (em que 1 + 1 Æ 0). Então V 
tem uma base na qual f é representada por uma matriz diagonal. 


O Algoritmo 12.1 mostra que cada matriz simétrica sobre K é congruente a uma matriz diagonal. Essa afirmação é 
equivalente à afirmação de que f tem uma representação diagonal. 


Seja q a forma quadrática associada à forma bilinear simétrica f. (Suponha que 1 + 1 Æ 0).Verifique a iden- 
tidade polar f (u, v) =! [a(u + v) — q(u) — q(v)]. 


Temos 


q(u + v) — a(u) — a(o) =f (u+ v, u+ v) Su) = f(v, v) 
=f(u,u) +f (u,v) +f(v,u) +f (v, v) =f (u, u) =f (v, v) = 2f (u, v) 


jax 

2 

S 
e 


Sel + 1 Æ 0, podemos dividir tudo por 2 para obter a identidade polar. 
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12.12 Considere a forma quadrática q(x, y) = 3x? + 2xy — y? e a substituição linear 
x=s—3t, y=2s+t 


(a) Reescreva q(x, y) em notação matricial e encontre a matriz A que representa q(x, y). 


(b) Reescreva a substituição linear usando notação matricial e encontre a matriz P correspondente à 
substituição. 


(c) Encontre g(s, t) usando substituição direta. 


(d) Encontre g(s, t) usando notação matricial. 


-1 1 =] 


(b) Temos[> = É Eh E Assim, P = Ê T eom X = i= [ilex = Pr. 


(c) Substituímos x e y em q para obter 
qls, t) = 3(s — 3t? + 2(s — 34) (2s + t) — (2s + t? 
= 3( — 6st +92) +2(2° — 5st — 38) — (48º + 4st + Ë) = 38º — 32st + 20? 


(a) Temos qy) = boo] 1 ilf | Assim, 4 = E | e400) = 474%, com X = þess)”. 


(d) Temos g(X) = X'AX eX = PY. Assim, X=YP e, portanto, 
1 2113 1 1 -3]Is 
t) = q4(¥) = YTPTAPY = j[s,t 
a(5,0) = 9(7) sds dh lb il 
3 —16 


5s 2 2 
= 3s” — 32st + 20t 
—16 20 | Lt 


[Conforme esperado, são iguais os resultados de (c) e (d).] 


12.13 Considere uma matriz diagonal A = diag(a,, ..., a,) qualquer sobre K. Mostre que, dados quaisquer escala- 
res não nulos k,,...,k, E€ K, Aé congruente à matriz diagonal D de entradas ak2, .. - , Qynk2. Além disso, 
demonstre as afirmações dadas. 


(a) Se K = C, podemos escolher D tal que cada entrada diagonal seja 1 ou 0. 
(b) Se K = R, podemos escolher D tal que cada entrada diagonal seja 1, —1 ou 0. 


Seja P = diag(Kk,, ..., k,). Então, 


TIET 


D = PAP = diag(k,) diag(a;) diag(k;) = diag(a;k?, ... ,a„kž) 


(a) Seja P = diag(b), com b; = 11 I/va; se q0 


se q =0 


Então todas as entradas diagonais de P'AP são iguais a 1 ou 0. 


(b) Seja P = diag(b), com b; = fa I/vlail se a; #0 


se a;=0 


Então todas as entradas diagonais de P'AP são iguais a 1,-1 ou 0. 
OBSERVAÇÃO Enfatizamos que (b) não segue válido trocando “congruência” por “congruência hermitiana”. 


12.14 Demonstre o Teorema 12.5. Seja f uma forma bilinear simétrica de V sobre R. Então existe uma base de V 
na qual f é representada por uma matriz diagonal. Qualquer outra representação matricial diagonal de f tem 
o mesmo número p de entradas positivas e o mesmo número n de entradas negativas. 


Pelo Teorema 12.4, existe uma base (u,, ..., u„} de V na qual fé representada por uma matriz diagonal com, digamos, p 
entradas positivas e n negativas. Agora, seja (w,, ..., w,) uma outra base de V, na qual f é representada por uma matriz 
diagonal com, digamos, p' entradas positivas e n’ negativas. Podemos supor, sem perda de generalidade, que as entradas 
positivas aparecem antes das demais, em cada matriz. Como pos(f) = p + n =p' + nº, basta provar que p = p”. 
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Sejam U o espaço gerado por u,, ..., u, e W o espaço gerado por Wp',1,---+W,. Então f(v, v) > O para cada vetor 
nãonulov EU, e f(v,v) < 0 para cada vetor não nulo v € W. Logo, U N W = {0}. Observe que dim U = pe 
dim W = n — p'. Assim, 


dim(U + W) = dim U + dimW — dim(U N W) =p + (n - p')—-0=p-p' +n 


Como dim(U + W) < dim V = n, resulta p— p' +n < n oup < p'. Analogamente, mostramos que p' < p, de 
modo que p = p', como queríamos mostrar. 


OBSERVAÇÃO A validade do Teorema 12.5 e a demonstração apresentada dependem tão somente do conceito de 
positividade. Assim, o teorema também é válido em qualquer subcorpo K do corpo real R, como o corpo racional 


Q. 


Formas quadráticas reais positivas 


12.15 Prove que são equivalentes as definições dadas de positividade. 
(a) São positivas as entradas diagonais de qualquer representação diagonal de q. 
(b) g(Y >0, para qualquer vetor não nulo Y de R”. 


Digamos que q(Y) = ayi + ay⁄ ++ + a,y2. Se todos os coeficientes forem positivos, claramente g(Y) > 0, 
sempre que Y Æ 0. Assim, (a) implica (b). Reciprocamente, suponha que (a) seja falso, ou seja, suponha que al- 
guma entrada diagonal a; < 0. Seja e, = (0, ..., 1,..., 0) o vetor com todas as entradas nulas, exceto por um 1 na 
k-ésima posição. Então g(e,) = a, não é positivo, de modo que (b) é falso. Assim, (b) implica (a). Em vista disso, 
(a) e (b) são equivalentes. 


12.16 Decida se a forma quadrática dada é positiva ou não. 


(a) q(x, y, z) = x? + 2y? — 4xz — 4yz + 77 


(b) q(x, y, Z) = x? +y? + 2xz + 4yz + 37? 


Diagonalizamos a matriz simétrica A correspondente a q via congruência. 


(a) Aplicamos as operações “Substituir R, por 2R, + R,” e “Substituir C, por 2C, + C,” e, depois, “Substituir R, por 
R, + Rj” e “Substituir C, por C, + C;”, obtendo 


1 0 —2 1 0 0 1 0 0 
A= 0 2 =2 0 2 2|/=/0 20 
-2 -2 7 0 —2 3 0 0 1 


A representação diagonal de q contém as entradas positivas 1, 2, 1 na diagonal. Assim, q é positiva. 


(b) Temos 


Há uma entrada negativa —2 na representação diagonal de q. Assim, q não é positiva. 
12.17 Mostre que q(x, y) = ax? + bxy + cy? é positiva se, e só se, a > 0 e o discriminante D = b? — 4ac < 0. 
Suponha que v = (x,y) £ 0. Então x Æ 0 ou y 0; digamos, y Æ 0. Seja t = x/y. Então 
2 
qo) =» [a(x/y)" + b(x/9) +e] = (a? + br +c) 


Contudo, as afirmações seguintes são equivalentes. 


G) s=af+bt+cé positiva para cada valor de t. 


Gi) s= a? + bt + c se situa acima do eixo t. 


Gii) a>0e D = b — 4ac < 0. 
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Assim, q é positiva se, e só se, a > 0 e D <0. [Observação: D < 0 é o mesmo que det(A) > 0, sendo A a matriz simétrica 
correspondente a q.) 


12.18 Decida se a forma quadrática dada é positiva ou não. 
(a) qx, y) =X — 4xy + 77°, 06) q(x, y) =x + 8xy + 57°, (0) qy) =3 + 2y +y? 
Calculamos o discriminante D = b? — 4ac e usamos o Problema 12.17. 
(a) D= 16 — 28 = -12. Como a = 1 > 0e D <0, q é positiva. 
(b) D = 64 — 20 = 44. Como D > 0, q não é positiva. 
(c) D=4- 12 = —8. Como a = 3 > 0 e D <0, q é positiva. 


Formas hermitianas 


12.19 Decida se a matriz dada é hermitiana. 


2 2+3i 4—5i 3 ti =3 
@) |2-3i 5 6+2i|, (b) [= (© 1 
4+5i 6H -7 4+i l 1 —6 


Uma matriz complexa A = [a,] é hermitiana se 4* = 4, ou seja, se di; 
(a) É hermitiana, por ser igual à transposta conjugada. 
(b) Não é hermitiana, mesmo sendo simétrica; por exemplo, o conjugado de i é —i. 


(c) E hermitiana. Observe que uma matriz real é hermitiana se, e só se, é simétrica. 


12.20 Seja A uma matriz hermitiana. Mostre que f(X, Y) = X7AY define uma forma hermitiana de C”. 
Dados a,b € Ce X,,X,, Y € C” quaisquer, 
F(aX, +bX, Y) = (aX, +bX,) AY = (axT + bXDJAY 
= aX AY + bXZ AÝ = af(X,Y) + bf (X%, Y) 
Logo, f é linear na primeira variável. Também 
TX) = XAY = (XAY) = YTATX = YTA*X = YTAR =f (Y,X) 
Assim, f é uma forma hermitiana de C”. 


OBSERVAÇÃO Utilizamos o fato de que XTAY é escalar e, portanto, igual à transposta. 


12.21 Sejam fuma forma hermitiana de Ve H a matriz de f na base S = (u,) de V. Prove as afirmações dadas. 


(a) f(u, v) = [SH para quaisquer u, v € V. 
(b) Se P é a matriz de mudança de base de S para uma nova base S' de V, então B = PTHP (ou B = O*HO, 
em que Q = P) é a matriz de f na nova base S’. 
Observe que (b) é o análogo complexo do Teorema 12.2. 
(a) Sejam u, v € V e suponha que u = aju] +---+au,ev=byu, +-::+ bu, Calculando, 
f(u, v) = Playa +++ aptin, biu +- + by) 
= = ab u pu) = [an --,a,]H [bi-n] = eds Hlos 


eD 
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(b) Sendo P a matriz de mudança de base de S para S', temos P[u]y = [ulçe P[vlg = [v]s, portanto, lu]; = lu]; P'e 


[ul = P[v] s- Assim, por (a), 


f(u, v) = us Hs = [uls PHP 


Como u e v são elementos arbitrários de V, concluímos que PT HP é a matriz de f na base S’. 


1 l+i 2i 
Considere a matriz hermitiana H = | 1 — i 4 2-3i 
—2i 2+3i 7 


Encontre uma matriz não singular P tal que D = PTHP seja diagonal. Também encontre a assinatura de H. 


Usamos um Algoritmo 12.1 modificado, que aplica as mesmas operações com as linhas, mas depois, o conjugado das 
operações correspondentes nas colunas. Assim, começamos formando a matriz em blocos M = [H, 1], como segue. 


1 l+i 2i 1 0 0 
M=|l-i 4 2-3i 0 10 
—2i 2+43i 7 001 


Aplicamos as operações “Substituir R, por (-1 + DR, + R,” e “Substituir R, por 2iR, + R,” com as linhas de M e depois 
as operações conjugadas correspondentes “Substituir C, por (-1 — DC, + C,” e “Substituir C, por -2iC, + C,” com as 
colunas, obtendo 


1 1l+i 2i 1 0 0 1 0 0 1 0 0 
0 2 = =l 0 e, então, 0 2 -Si-l+i 1 0 
0 Si 3 2i 0 1 0 5i 3 2i 0 1 


Agora aplicamos a operação “Substituir R, por —5iR, + 2R,” e a operação conjugada correspondente “Substituir C, por 
5iC, + 2C}, obtendo 


1 0 0 1 0 0 10 0 1 0 0 
0 2 —5i —-l+i 1 0 e, então, 0 2 0 —-l+i 1 0 
0 0 19- 5+9i Si 2 0 0 —38 SFI- —Si 2 


Agora, H foi diagonalizada e a transposta de P está na metade à direita de M. Assim, tomamos 


1 —I+i 5+09i 1 0 0 
P= |0 1 —Si e, então, D=P'HP=I|0 2 0 
0 0 2 0 0 —38 


Observe que D tem p = 2 elementos diagonais positivos en = 1 entrada negativa. Assim, a assinatura de H é sig(H) = 
p—n=2-1=1. 


Formas bilineares alternadas 
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Demonstre o Teorema 12.3. Seja fuma forma bilinear alternada de V. Então existe uma base de V na qual fé 
1 : ou 0. O número de blocos 


não nulos é determinado de modo único por f [porque é igual à metade do posto de f]. 


representada por uma matriz diagonal em blocos M com blocos do tipo | k 


Se f = 0, o teorema é trivialmente verdadeiro. Também, se dim V = 1, então (ru, r,u) = r;rf(u, u) = 0 e, portanto, f = 
O. Em vista disso, podemos supor que dim V > 1 e que f 0. 

Como f Æ 0, existem vetores (não nulos) u4, u, € V tais que f(u, u2) # 0. De fato, multiplicando u, por um fator 
apropriado, podemos supor que f (u1, u3) = le, portanto, f (uz, u1) = —1. Segue que u, e u, são linearmente indepen- 
dentes, pois, se u, = ru,, digamos, então f(u,, u,) = f(u, ru) = rflu,, u) = 0. Denotando U = ger(u,, u,), obtemos as 
afirmações a seguir. 
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G) A representação matricial da restrição de fa U na base (u,, u,} é | E al 
Gi) Seu € U, digamos, u = au, + bu,, então 
f(u,u) =f(au; + bw, u) =—b e f(u, u) =f (au +bu, m)=a 
Seja W o conjunto daqueles vetores w € V para os quais f(w,u) =0 e f(w,u,) = 0, ou seja, 
W = {w € V : f(w,u) = 0 para todo u € U} 


Afirmamos que V = U & W. É claro que U N W = {0}, de modo que basta mostrar que V = U + W. Seja v € V dado. 
Tomamos 


u = f (v, u Ju; — f (v, u; juz e w=v—u (1) 


Como u é uma combinação linear de u, e u,, temos u,,u E€ U. 
Mostremos que w € W. Por (1) e (ii), f (u, u) = f (v, u ), portanto, 


f(w, um) =f(v-u, u) =f(v,u) -f (u, u)=0 
Analogamente, f (u, u) = f (v, u) e, portanto, 


f(w, u) +f (v =u, u) =f (v, uz) — f(u, uz) =0 


Então w € W e, por (1) segue que v = u + w, com u € W. Dessa forma, mostramos que V = U + W. Assim, 
V=U 9K. 

Resta observar que a restrição de fa W é uma forma bilinear alternada de W. Por indução, existe uma base u, ..., u, de 
W na qual a representação matricial da restrição de fa W tem o formato procurado. Assim, u,, Uz, Us, ..., U, é uma base 
de V na qual a representação matricial de f tem o formato procurado. 


Problemas Complementares 


Formas bilineares 
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12.25 


12.26 


12.27 


12.28 


Sejam u = (x,,x,) e v = (y1, y2). Decida se a aplicação dada é uma forma bilinear de R? ou não. 


(a) f(u, v) = 2x1y2 = 3x2y1, (c) f(u, v) = 3x2y2, (e) f(u, v) = 1, 
b) f(u, v) =x +), (d) f(u, v) = xx +yz, (£) f(u, v)=0 


Seja f a forma bilinear de R? definida por 


Finx), oy) = 3y; — 2x1y2 + 4y; — ay» 
(a) Encontre a matriz A de fna base (u, = (1, 1), u, = (1, 2)}. 
(b) Encontre a matriz B de fna base (v, = (1, —1), v, = (3, 1)). 
(c) Encontre a matriz de mudança de base P de (u,) para (v,) e verifique que B = P'AP. 
Seja V o espaço vetorial das matrizes quadradas de ordem 2 sobre R. Seja M = Ê | dada e defina a aplicação f(A, 


B) = tr(A/MB), para 4,B € V, em que “tr” denota o traço. (a) Mostre que f é uma forma bilinear de V. (b) Encontre a 


matriz de f na base 
1 0 01 0 0 0 0 
0 0f |O 0" |1 0P JO 1 


Seja B(V) o conjunto das formas bilineares de V sobre K. Prove as afirmações seguintes. 
(a) Se f,g € B(V), então f +g, kg € B(V), para qualquer k € K. 


(b) Se geo são funcionais lineares de V, então f(u, v) = ġ(u)a(v) pertence a B(V). 


Denotemos por [f] a representação matricial de uma forma bilinear f de V em relação a uma base (u,, ..., u,) de V. Mos- 
tre que a aplicação f + [7] é um isomorfismo de B(V) sobre o espaço vetorial das matrizes quadradas de ordem n. 
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12.30 


12.31 


12.32 


Seja f uma forma bilinear de V. Dado um subconjunto S qualquer de V, sejam 
S+ = {v € V: f(u, v) = O para cadau E€ S} e S! = {v€ V: f(v,u) = 0 para cada u € S} 


Mostre que (a) ST e ST são subespaços de V; (b) S} C S implica S+ C Si e sI E Si; 
(o) {0} ={0} =F. 


Seja fuma forma bilinear de V. Prove que pos(f) = dim V — dim V+ = dim V — dim V" e que, portanto, V+ =dim VT. 
Seja f uma forma bilinear de V. Dado qualquer u € V, defina û:V —> K e ù:V — K por úlx) =f (x,u) e 
ü(x) = f (u, x). Prove as afirmações seguintes. 

(a) ú e úsão lineares, ou seja, ú,u € V*. 

(b) um à e u ù são transformações lineares de Vem V*. 


(c) pos (f) = pos (u> à) = pos (u + à). 


Mostre que a congruência de matrizes (denotada por ~) é uma relação de equivalência, isto é, 


(a) A ~ A; (ii) se A ~ B, então B ~ A; (iii) se A ~ B e B ~ C, então A ~ C. 


Formas bilineares simétricas, formas quadráticas 


12.33 


12.34 


12.35 


12.36 


12.37 


12.38 


12.39 


Encontre a matriz simétrica A associada à forma quadrática dada. 
(a) q(x,y,7) — 2x? — 8xy +y? — 16xz + 14yz + 52, (0) q(x, y, z) = xy +y? + 4xz +2 
©) q(x,y,2) =" -xz +, (d) q(x,y,2)=xy +yz 


Encontre uma matriz não singular P tal que D = P'AP seja diagonal, nos casos de A dados. 


1 0 2 t=} 1 o 

(a) 4=|0 3 6|,(b) 4=|-2 5 3lilo) 4= 
2 67 1 3 -2 n A 
z 0 Doi 


Sejam q(x, y) = 2x? — 6xy — 3y? e x=s+2t,y=3s-—t. 
(a) Reescreva q(x, y) em notação matricial e encontre a matriz A que representa a forma quadrática. 
(b) Reescreva a substituição linear usando notação matricial e encontre a matriz P correspondente à substituição. 


(c) Encontre g(s, t) usando (i) substituição direta, (ii) notação matricial. 


Para a forma quadrática q(x, y, z) dada, encontre uma substituição linear não singular escrevendo as variáveis x, y, z em 
termos de variáveis r, s, t tais que g(r, s, f) seja diagonal. 

(a) q(x, y, z) = x? + 6xy + 8y? — 4xz + 2yz — 922, 

(b) g(x,y,z7)=2 — 3y? + 8xz + 12yz + 252º, 

(0) q(x, y, Z) = x? + 2xy + 3y? + 4xz + 8yz + 622. 


Em cada caso, encontre o posto e a assinatura da forma. 
Dê um exemplo de uma forma quadrática q(x, y) tal que g(u) =0 e q(v) = 0, mas q(u + v) £ 0. 


Seja S(V) o conjunto de todas as formas bilineares simétricas de V. Mostre que 


(a) S(V) é um subespaço de B(V); (b) se dim V = n, então dim S(V) = in(n +1). 


n 
Considere um polinômio real quadrático q(%1,..-,Xn) = Dye aijXiXj, com a, = a; 
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(a) Sea, 0, mostre que a substituição 


dd EP (ap) +: + Gn); XxX =), ne.) Xn = Yn 
1 


fornece a equação q(x4, - . - , Xp) = a11 V7 + d'2,- - - , Yn), em que q' também é um polinômio quadrático. 


(b) Sea, = 0, mas, digamos, a42 # 0, mostre que a substituição 
X1 =y +J2; X2 =y =), X3 = y3, nes Xn = Yn 


fornece a equação CICESE N EDD bij Yi Yj, em que bj, Æ 0, o que reduz esse caso ao caso (a). 


OBSERVAÇÃO Esse método de diagonalização de q é conhecido como completamento do quadrado. 


Formas quadráticas positivas 


12.40 Decida se a forma quadrática dada é positiva ou não. 


(a) q(x, y) = 4 + 5xy + 77, (0) q(x, y, Z) = x? + 4xy + 5y? + 6xz + 2yz + 42? 
b) g(x,y) = 2x — 3xy - 7°, (d) g(x,y, z) = x? + 2xy + 2y? + 4xz + 6yz + 72° 


12.41 Encontre os valores de k com os quais a forma quadrática dada é positiva. 


(a) qy) = = Syth, 6) qy) = 3P = ky + 12y? 
(©) q(x, y, Z) = x? + 2xy + 2y% + 2xz + 6yz + kz? 


12.42 Seja A uma matriz real simétrica positiva. Mostre que A = P”P, para alguma matriz não singular P. 


Formas hermitianas 


12.43 Modifique o Algoritmo 12.1 de tal modo que, para uma dada matriz hermitiana H, produza uma matriz não singular P 
tal que D = PTHP seja diagonal. 


12.44 Encontre uma matriz não singular P tal que D = PTHP seja diagonal, nos casos de H dados. 
; ; 1 i 2+i 
(a) =| F (b) Belgia ea fds [= 2 isi 
' i d=j li 2 
Em cada caso, encontre o posto e a assinatura da matriz. 


12.45 Seja A uma matriz complexa não singular. Mostre que H = A*A é hermitiana e positiva. 


12.46 Dizemos que B é congruente hermitianamente a A se existir uma matriz não singular P tal que B = PTAP ou, equivalen- 
temente, se existir uma matriz não singular Q tal que B = Q*AQ. Mostre que a congruência hermitiana é uma relação 
de equivalência. (Observação: se P = Q, então PTAP = O*AQ.) 


12.47 Demonstre o Teorema 12.7. Seja fuma forma hermitiana de V. Então existe uma base S de V na qual f é representada 
por uma matriz diagonal e qualquer outra representação diagonal de ftem o mesmo número p de entradas positivas e o 
mesmo número n de entradas negativas. 


Problemas variados 


12.48 Sejam e uma operação elementar com as linhas e f* a correspondente operação conjugada com as colunas (em que cada 
escalar k de e é substituído pelo conjugado k em f*). Mostre que a matriz elementar correspondente a f* é a transposta 
conjugada da matriz elementar correspondente a e. 


12.49 Sejam Ve W espaços vetoriais sobre K. Dizemos que uma aplicação f:V x W — K é uma forma bilinear de Ve W se 
© flav +bw, w) = af(v,w) +bf(v,w), 
Gi) f(v, aw; + bw) = af (v, w1) + bf (v, w2) 
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para quaisquer 4, b € K, v; € V, w; € W. Demonstre as afirmações seguintes. 


(a) O conjunto B(V, W) de todas as formas bilineares de V e W é um subespaço do espaço vetorial das aplicações de 
V x W emK. 


(b) Se(d,,..., Ọm} é uma base de V* e [o,,...,0,) uma base de W*, então Ujii=1,...m,j=1,...,n) é uma base 
de B(V, W), sendo f, definido por f;(v,w) = d;(v)o;(w). Assim, dim B(V, W) = dim V dim W. 
[Observe que, se V = W, então obtemos o espaço B(V) estudado neste capítulo.] 
m vezes 


& . . . ss = 2 sje 
Seja V um espaço vetorial sobre K. Dizemos que uma aplicação f:V x V x... x V — K é uma forma multilinear (ou 
m-linear) de V se fé linear em cada variável, ou seja, para cada i = 1, ..., m, 


f(-., au+bv, ...)=af(... û,...) +bf(..,0,...) 
em que M denota o i-ésimo elemento, sendo todos os demais elementos mantidos fixados. Dizemos que uma forma 
m-linear é alternada se f(v,, ..., Un) = 0, sempre que v; = v, para i 4 j. Demonstre as afirmações seguintes. 


(a) O conjunto B,(V) de todas as formas m-lineares de V é um subespaço do espaço vetorial das aplicações de 
VxVx:-xVemk. 


(b) O conjunto A (V) das formas m-lineares alternadas de V é um subespaço de B (V). 


m m 


OBSERVAÇÃO 1 Sem = 2, obtemos o espaço B(V) estudado neste capítulo. 


OBSERVAÇÃO 2 Se V = K”, então a função determinante é uma forma alternada m-linear de V. 


Respostas dos Problemas Complementares 


Notação: M = [R;; R,; ...| denota uma matriz M de linhas R,, R,, ... 
12.24 (a) É, (b) Não é, (c) É, (d) Não é, (e) Não é, (f) É. 
12.25 (a) 4=[4,1; 7,3], (b) B= [0,—4; 20,32], (co) P=[3,5; —2,-2] 
12.26 (b) [1,0,2,0; 0,1,0,2; 3,0,5,0; 0,3,0,5] 
12.33 (a) B2, 4, 8; 4,1,7, 8,7,5], (b) [1,0,-5; 0,1,0; —1,0,0), 
(o) [0,3,2; },1,0; 201], (O [0,540 ż,0,1; },0,3; 0,3,0] 
12.34 (a) P= [1,0,—2; 0,1,—2; 0,0,1], D = diag(1,3,—9); 
(b) P=[1,2,-11; 0,1,-5; 0,0,1], D = diag(1,1,—28); 
(co) P=[1,1,-1,-4; 0,1,—1,—2; 0,0,1,0; 0,0,0,1], D = diag(1, 1,0, —9) 
12.35 4=[2,-3; —3,—3], P = [1,2; 3,—1], g(s, t) = —438º — 4st + 17° 
12.36 (a) x=r-—3s-19t, y=s+7t, z=t; q(r,s,t) = r — 3 + 36; 
(b) x=r-2t, y=s+2t, z=t;, q(r,s,t) = 2r? — 38 + 29%; 
(0) x=r-s-t, y=s-t, 2z=t; q(r,s,t) = r — 25 
12.37 q(x,y) = — x°, u = (1,1), v = (1,—1) 
12.40 (a) É, (b) Não é, (c) Não é, (d) É 
12.41 (a) k>%, (b) —I2<k<12, (co) k>5 
12.44 (a) P=[1,i; 0,1, D=I,s = 2; (b) P=[1,-2+3i; 0,1], D = diag(1,—14), s = 0; 


() P=[Li,-3+i; 0,1,i; 0,0,1], D = diag(1,1,—4),s = 1 


Operadores Lineares em 
Espaços com Produto Interno 


13.1 INTRODUÇÃO 


Neste capítulo investigamos o espaço A(V) dos operadores lineares T de um espaço com produto interno V. (Ver 
Capítulo 7.) Assim, o corpo K ou é o corpo dos reais R ou é o corpo dos complexos C. Na verdade, utilizamos 
terminologias diferentes para o caso real e o caso complexo. Também utilizamos o fato de que os produtos internos 
dos espaços euclidianos real R” e complexo C” poderem ser definidos, respectivamente, por 


(uuv=uv e (uv=ulv 
onde u e v são vetores coluna. 

O leitor deveria rever o conteúdo do Capítulo 7 para estar bastante familiarizado com os conceitos de norma 
(comprimento), ortogonalidade e bases ortonormais. Observamos, também, que no Capítulo 7 tratamos, principal- 
mente, com espaços com produtos internos reais, ao passo que aqui vamos supor que V é um espaço com produto 
interno complexo, salvo menção em contrário. 

Finalmente, observamos que no Capítulo 2 denotamos a transposta conjugada de uma matriz complexa A por 
A”, isto é, A” = AT, Essa notação não é padrão. Muitos textos, principalmente os mais avançados, usam A* para 
denotar essa matriz. Passamos a utilizar essa notação neste capítulo. Assim, agora, 4* = AT. 


13.2 OPERADORES ADJUNTOS 


Começamos com uma definição básica. 


DEFINIÇÃO Dizemos que um operador linear T de um espaço com produto interno V tem um operador adjunto 
T* de V se (T (u), v) = (u, T*(v)), para quaisquer u, v € V. 


No exemplo a seguir, mostramos que o operador adjunto tem uma descrição simples no contexto das transfor- 
mações matriciais. 


Exemplo 13.1 


(a) Seja A uma matriz real quadrada de ordem n vista como um operador linear de R” Então, dados u, v € R, 
quaisquer, 


(Au, v) = (Au) v = uf ATv = (u, AT v) 


Assim, a transposta A” de A é a adjunta de A. 
(b) Seja B uma matriz complexa quadrada de ordem n vista como um operador linear de C”. Então, dados u, v, e C” 
quaisquer, 


(Bu, v) = (Bu) = uT BT = uTB*0 = (u,B*v) 


Assim, a transposta conjugada B* de B é a adjunta de B. 
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OBSERVAÇÃO A notação B* pode significar tanto a adjunta de B como um operador linear ou a transposta con- 
jugada de B como uma matriz. Pela parte (b) do exemplo precedente, essa ambiguidade é irrelevante, pois ambas 
denotam o mesmo objeto. 


O teorema seguinte (demonstrado no Problema 13.4) é o resultado principal desta seção. 


Teorema 13.1 Seja T um operador linear de um espaço vetorial com produto interno V de dimensão finita sobre 
K. Valem as afirmações a seguir. 
(i) Existe um único operador linear T* de V tal que (T (u), v) = (u, T*(v)), para quaisquer 
u, v € V. (Ou seja, T tem um adjunto T+.) 
Gi) Se A é a representação matricial de T em relação a uma base ortonormal S = (u,) de V, então 
a representação matricial de T* na base S é a transposta conjugada A* de A (ou a transposta A” de 
A se K for real). 


Enfatizamos que essa relação simples entre as representações matriciais de T e de T* não existe se S$ não for 
ortonormal. Assim, vemos uma propriedade útil das bases ortonormais. Também enfatizamos que esse teorema não 
é válido se V tiver dimensão infinita (Problema 13.31). 

O teorema seguinte (demonstrado no Problema 13.5) resume algumas das propriedades do adjunto. 


Teorema 13.2 Sejam T, T,, T, operadores lineares de Ve seja k € K. Então 
O (G+DP)* =+, GD) (AE)*= TI, 
Gi) (kT)* = kT*, (iv). (T*)" =T. 
Observe a semelhança entre esse teorema e o Teorema 2.3 relativo às propriedades da operação de transposição 
de matrizes. 


Funcionais lineares e espaços com produto interno 


No Capítulo 11 vimos que um funcional linear ) de um espaço vetorial V é uma transformação linear ġ:V — K. 
Nessa subseção apresentamos um resultado básico (Teorema 13.3) que é utilizado na demonstração do importante 
Teorema 13.1. 

Seja V um espaço com produto interno. Cada u € V determina uma aplicação à: — K definida por 


û(v) = (v,u) 
Agora, dados quaisquer a, b € Ke v4, v € V, temos 

ú(av; + bv) = (av + bv, u) =a(v,,u) + b(v,,u) = aú(v) + bú(v,) 
Assim, à é um funcional linear de V. A recíproca também é verdadeira em espaços de dimensão finita e está in- 
cluída no importante teorema a seguir (demonstrado no Problema 13.3). 
Teorema 13.3 Seja h um funcional linear de um espaço com produto interno V de dimensão finita. Então existe 
um único vetor u € V tal que P(v) = (v, u), para cada v € V. 


Observamos que esse teorema não é válido em espaços de dimensão infinita (Problema 13.24). 


13.3 ANALOGIA ENTRE A(V) E C, OPERADORES LINEARES ESPECIAIS 


Seja A(V) a álgebra de todos os operadores lineares de um espaço com produto interno V de dimensão finita. A apli- 
cação adjunta T +» T* de A(V) é muito parecida com a aplicação de conjugação z ++ Z do corpo dos complexos C. 
Para ilustrar essa analogia, identificamos na Tabela 13-1 certas classes de operadores T € A(V) cujo comportamen- 
to pela aplicação adjunta imita o comportamento pela conjugação de certas classes de números complexos. 

A analogia entre esses operadores T e os números complexos z é refletida no próximo teorema. 
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Tabela 13.1 
Classe de números Comportamento Comportamento pela 
complexos pela conjugação Classe de operadores de A(V) aplicação adjunta 
Círculo unitário (|z| = 1) Z= 1/z Operadores ortogonais (caso real) T* = T! 
Operadores unitários (caso complexo) 
Eixo real Z=z Operadores autoadjuntos T*=T 
Também denominados simétricos (caso 
real) ou hermitianos (caso complexo) 
Eixo imaginário Z= -z Operadores antiadjuntos T* = -T 


Também denominados 
antissimétricos (caso real) anti-hermitianos 
ou (caso complexo) 


Eixo real positivo (0, 00) z=wŵw,w £0 Operadores positivos T = S*S; 
com S não singular 


Teorema 13.4 Seja À um autovalor de um operador linear T de V. 


(i) Se T* = T7! (ou seja, T é ortogonal ou unitário), então |2| = 1. 
(ii) Se T* = T (ou seja, T é autoadjunto), então À é real. 
Gii) Se T* = —T (ou seja, T é antiadjunto), então À é imaginário puro. 


(iv) Se T = S*S com S não singular (ou seja, T é positivo), então À é real e positivo. 
Demonstração. Em cada caso, seja v um autovetor não nulo de T associado a À; ou seja, T(v) = Av, com v Æ 0. 
Logo, (v, v) é positivo. 
Demonstração de (i). Mostramos que 21(v, v) = (v, v): 
10,0) = (40,20) = (T (v), T(v)) = (v, T*T(0)) = (v, I(0)) = (0,0) 
Como (v, v) Æ 0; temos 2) = 1e, portanto, |4| = 1. 
Demonstração de (ii). Mostramos que À (v, v) = A(v, v): 
Alu, v) = (v, v) = (T (v), v) = (Po) = (v, T(v)) = w, Av) = Alv, v) 
Como (v, v) £ 0; temos À = 2e, portanto, À é real. 


Demonstração de (iii). Mostramos que 2(v, v} = —A(v, v): 


Como (v, v} £ O; temos À) = —A ou À = —Je, portanto, À é imaginário puro. 


Demonstração de (iv). Observe, inicialmente, que S(v) 0, pois S é não singular. Logo, (S(v), S(v)) é posi- 
tivo. Mostramos que À(v,v) = (S(v),S(v)). 


Alu, v) = (Av, v) = (T(0),v) = (S*S(v), v) = (S(v), S(v)) 


Como (v, v) e (S(v), S(v)} são positivos, temos que À é positivo. 
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OBSERVAÇÃO Cada um desses operadores T comuta com seu adjunto, isto é, TT* = T*T. Tais operadores são 
denominados operadores normais. 


13.4 OPERADORES AUTOADJUNTOS 
Seja Tum operador autoadjunto de um espaço com produto interno V, isto é, 
T = T* 


(Se T estiver dado por uma matriz A, então A é simétrica ou hermitiana de acordo com A ser real ou complexa.) 
Pelo Teorema 13.4, os autovalores de T são reais. Uma outra propriedade importante de T é dada no teorema se- 
guinte. 


Teorema 13.5 Sejam T um operador autoadjunto de V e u e v autovetores de T associados a autovalores distintos. 
Então u e v são ortogonais, isto é, (u, v) = 0. 
Demonstração. Digamos que T (u) = Ajue T(v) = Av, com å; Æ 23. Mostramos que À, (u, v) = 4, (u, v). 
Au, v) = (Aq, v) = (T(u), v) = (u, T*(0)) = (u, T(v)) 
= (u, 20) = do (u, v) = Az (u, v) 


(A quarta igualdade decorre de T* = T e a última usa o fato de que o autovalor 2, é real.) Como 2, Æ 2,, obtemos 
(u, v} = 0, demonstrando o teorema. 


13.5 OPERADORES ORTOGONAIS E UNITÁRIOS 
Seja U um operador linear de um espaço com produto interno V de dimensão finita tal que 
U* = U7! ou, equivalentemente, UU*= U*UŲU =I 


Já vimos que U é denominado ortogonal ou unitário, dependendo de o corpo subjacente ser real ou complexo. O 
teorema seguinte (demonstrado no Problema 13.10) dá uma caracterização alternativa desses operadores. 
Teorema 13.6 As condições seguintes sobre um operador U são equivalentes. 

(i) U* = U-l, isto é, UU* = U*U = I. [U é unitário (ortogonal).) 

(ii) U preserva produtos internos, isto é, dados v, w € V, quaisquer, (U (v), U(w)) = (v, w). 


(iii) U preserva comprimentos, isto é, ||U(w)|| = llel], para cada v € V. 


Exemplo 13.2 


(a) Seja T:R? — R° o operador linear que gira cada vetor v horizontalmente em torno do eixo z por um ângulo 0 
fixado, conforme Figura 10-1 (Seção 10.3). Esse operador é definido por 


T(x,y,z) = (xcos0 — ysen0, xsen0 +ycos0, z) 


Observamos que os comprimentos (distâncias a partir da origem) são preservados por T. Assim, T é um ope- 
rador ortogonal. 


(b) Seja Vo espaço de Hilbert 7, definido na Seção 7.3. Seja T:V — V o operador linear definido por 
T(a,,a,,a3, oi .) E (0, a1, a3, a3, pas .) 


Claramente, T preserva produtos internos e comprimentos. Contudo, T não é uma aplicação sobrejetora por- 
que, por exemplo, (1, 0, O, ...) não pertence à imagem de T; logo, T não é invertível. Vemos, assim, que o Teo- 
rema 13.6 não é válido em espaços de dimensão infinita. 
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Um isomorfismo de um espaço com produto interno sobre um outro é uma aplicação bijetora que preserva as 
três propriedades básicas de um espaço com produto interno: a soma de vetores, a multiplicação por escalar e o 
produto interno. Assim, as transformações ortogonais e unitárias também podem ser caracterizadas como os iso- 
morfismos de V sobre si mesmo. Observe que uma transformação U dessas também preserva distâncias, já que 


lU) = UM = [U -= ml = llv — wli 


Por isso, também dizemos que U é uma isometria. 


13.6 MATRIZES ORTOGONAIS E UNITÁRIAS 


Seja U um operador linear de um espaço com produto interno V. A partir do Teorema 13.1, obtemos os resultados 
a seguir. 


Teorema 13.7a Uma matriz complexa A representa um operador unitário U (em relação a alguma base ortonor- 
mal) se, e só se, 4* = A. 


Teorema 13.7b Uma matriz real A representa um operador ortogonal U (em relação a alguma base ortonormal) 
se, e só se, AT = 41 


Esses teoremas motivam as definições seguintes (apresentadas nas Seções 2.10 e 2.11). 
DEFINIÇÃO Uma matriz complexa A tal que 4* = 47! é denominada matriz unitária. 


DEFINIÇÃO Uma matriz real A tal que 47 = 4"! é denominada matriz ortogonal. 


Repetimos o Teorema 2.6, que caracteriza essas matrizes. 


Teorema 13.8 Seja A uma matriz. As afirmações seguintes são equivalentes. 


(i) A é unitária (ortogonal). 
(11) As linhas de A constituem um conjunto ortonormal. 
(iii) As colunas de A constituem um conjunto ortonormal. 


13.7 MUDANÇA DE BASES ORTONORMAIS 


As bases ortonormais desempenham um papel especial na teoria dos espaços vetoriais com produto interno V. 
Assim, naturalmente estamos interessados nas propriedades da matriz de mudança de base de uma dessas bases 
para outra. Vale o teorema seguinte (demonstrado no Problema 13.12). 


Teorema 13.9 Seja (u,, ..., u,) uma base ortonormal de um espaço com produto interno V. Então, a matriz de 
mudança de base de {u;} para uma outra base ortonormal é unitária (ortogonal). Reciprocamente, se P = [a,] é uma 
matriz unitária (ortogonal), então o conjunto dado a seguir é uma base ortonormal de V. 


1 É és 
{u; = ajju] + dzji +++ + apip i E5 1, A} 


Sabemos que matrizes A e B que representam um mesmo operador linear T são semelhantes, isto é, B = P71AP, 
onde P é a matriz (não singular) de mudança de base. Por outro lado, se V é um espaço com produto interno, esta- 
mos usualmente interessados no caso em que P é unitária (ou ortogonal), como foi sugerido no Teorema 13.9. 
(Lembremos que P é unitária se sua inversa for a transposta conjugada P* = P~! e que P é ortogonal se sua inver- 
sa for a transposta P? = P-!) Isso conduz à seguinte definição. 


DEFINIÇÃO As matrizes complexas A e B são unitariamente equivalentes se existir alguma matriz unitária P tal 
que B = P*AP. Analogamente, as matrizes reais A e B são ortogonalmente equivalentes se existir alguma matriz 
ortogonal P tal que B = P'AP. 


Observe que matrizes ortogonalmente equivalentes são necessariamente congruentes. 


L  Árcesra Linear 


13.8 OPERADORES NÃO NEGATIVOS E POSITIVOS 


Seja P um operador linear de um espaço com produto interno V. Dizemos que 


(1) P é positivo se P = S*S, para algum operador não singular S. 
(11) P é não negativo se P = S*S, para algum operador S. 


Uma caracterização alternativa desses operadores é dada nos teoremas seguintes. 


Teorema 13.10a Seja P um operador. As afirmações seguintes são equivalentes. 


(i) P = T?, para algum operador não singular autoadjunto T. 
(ii) P é positivo. 
(iii) P é autoadjunto e (P(u),u) > 0, para cada u Æ O de V. 


Vale o teorema correspondente para operadores não negativos (demonstrado no Problema 13.21). 


Teorema 13.10b Seja P um operador. As afirmações seguintes são equivalentes. 


G) P = T2, para algum operador autoadjunto T. 
(11) P é não negativo, isto é, P = S*S, para algum operador S. 
(iii) P é autoadjunto e (P(u),u) > 0, para cada u € V de V. 


13.9 DIAGONALIZAÇÃO E FORMAS CANÔNICAS EM ESPAÇOS 
COM PRODUTO INTERNO 


Seja T um operador linear de um espaço com produto interno V de dimensão finita sobre o corpo K. A representa- 
ção de T por uma matriz diagonal depende dos autovetores e autovalores de T e, portanto, depende das raízes do 
polinômio característico A(t) de T. Agora, A(t) sempre se fatora em polinômios lineares sobre o corpo complexo 
C, mas pode não conter fatores lineares sobre o corpo real R. Assim, a situação para espaços com produto interno 
reais (também denominados espaços euclidianos) é intrinsecamente diferente da situação para espaços com produ- 
to interno complexos (também denominados espaços unitários) e, portanto, serão tratados separadamente. 


Espaços com produto interno reais, operadores simétricos e ortogonais 


Vale o teorema seguinte (demonstrado no Problema 13.14). 


Teorema 13.11 Seja Tum operador simétrico (autoadjunto) de um espaço com produto interno real V de dimen- 
são finita. Então existe uma base ortonormal de V constituída por autovetores de T, isto é, T pode ser representado 
por uma matriz diagonal em relação a alguma base ortonormal. 


Segue a afirmação correspondente para matrizes. 


Teorema 13.11 (Forma Alternativa) Seja A uma matriz simétrica real. Então existe uma matriz ortogonal P tal 
que B = P-14P = PTAP é diagonal. 


Podemos escolher as colunas da matriz P do enunciado como autovetores ortogonais normalizados de A; en- 
tão, os elementos diagonais de B são os autovalores associados. 

Por outro lado, um operador ortogonal T não precisa ser simétrico, logo, pode não ser representável por uma 
matriz diagonal em relação a uma base ortonormal. Entretanto, um operador T desses possui uma representação 
canônica simples, conforme descrito no teorema a seguir (demonstrado no Problema 13.16). 
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Teorema 13.12 Seja Tum operador ortogonal de um espaço com produto interno real V. Então existe uma base 
ortonormal de V na qual T é representado por uma matriz diagonal em blocos M do tipo 


: cos0, —senô cos. —sen6 
M = diag| I, —L, Í a eo E r 
sen 9, cos 0) sen, — cos0, 
Observemos que cada um dos blocos diagonais 2 x 2 representa uma rotação num subespaço de dimensão dois 
associado e que cada elemento diagonal —1 da matriz —/, oposta da identidade representa uma reflexão num subes- 
paço unidimensional associado. 


Espaços com produto interno complexos, operadores normais e triangulares 


Dizemos que um operador linear T é normal se comutar com seu adjunto, isto é, se TT* = T*T. Observe que os 
operadores normais incluem ambos os operadores autoadjuntos e os unitários. 

Analogamente, dizemos que uma matriz complexa A é normal se comutar com sua transposta conjugada, isto 
é, se AA * = A*A. 


2 


E 1 
Exemplo 13.3 Seja A = E 343i 


| Então 4* = | l = 


4 $ = 
1 = também, 44 =l 


1 Ee] er Ad 
342i 14 [-4 A. Assim, 
A é normal. 

Vale o teorema seguinte (demonstrado no Problema 13.19). 
Teorema 13.13 Seja T um operador normal de um espaço com produto interno complexo V de dimensão finita. 


Então existe uma base ortonormal de V constituída por autovetores de T, isto é, T pode ser representado por uma 
matriz diagonal em relação a alguma base ortonormal. 


Segue a afirmação correspondente para matrizes. 


Teorema 13.13 (Forma Alternativa) Seja A uma matriz normal. Então existe uma matriz unitária P tal que 
B = PAP = P*AP é diagonal. 


No teorema a seguir (demonstrado no Problema 13.20) vemos que mesmo operadores de espaços unitários que 
não sejam normais têm uma forma relativamente simples. 


Teorema 13.14 Seja Tum operador qualquer de um espaço com produto interno complexo V de dimensão finita. 
Então T pode ser representado por uma matriz triangular em relação a alguma base ortonormal de V. 


Teorema 13.14 (Forma Alternativa) Seja A uma matriz complexa qualquer. Então existe uma matriz unitária P tal 
que B = P'AP = P*AP é triangular. 
13.10 TEOREMA ESPECTRAL 


O teorema espectral é uma reformulação dos teoremas de diagonalização 13.11 e 13.13. 


Teorema 13.15 (Teorema Espectral) Seja Tum operador normal (simétrico) de um espaço com produto interno V 
complexo (real) de dimensão finita. Então existem operadores lineares E}, ..., E, de Ve escalares 2,,..., A, tais que 


O T=4E +4 ++, (Gi) Æ = EE =E E = E, 
0) E&t+tE teti (iv) EE,=o0 parai # j. 
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Esses operadores lineares E,, ..., E, de V são projeções, isto é, E? = E,. Além disso, são projeções ortogonais, 
porque têm a propriedade adicional que E,E, = 0, com i ÉJ. 

No exemplo a seguir, vemos a relação entre a representação matricial diagonal e as correspondentes projeções 
ortogonais. 


Exemplo 13.4 Considere as matrizes diagonais A, E,, E,, E, seguintes. 


2 1 0 0 


Temos 


(1) 4 =2E, +3E, + 5E, (ii) E; +E, +E; =7, (ñi) £? = E, (iv) E;E;=0, com i#j. 


Problemas Resolvidos 


Operadores adjuntos 


13.1 Encontre o adjunto do operador F:R? — R? definido por 


F(x,y,z)=(3x+4p—5z, 2x— 6y +72, 5x — 9y+2) 


Começamos calculando a matriz A que representa F na base canônica de Rº, ou seja, a matriz A cujas colunas são os 
E . T 
coeficientes de x, y, z e, depois, tomamos a transposta 4 de A, como segue. 


3 4 -5 3 2 5 
4A=I|2 -6 7 e então AÆT=]| 4 -6 -9 
5 -9 1 25 F aj 


A adjunta F* é representada pela transposta de A; logo, 


F*(x,y,z) = (3x + 2y + 5z, 4x — 6y — 9z, —5x + 7y +z) 


13.2 Encontre o adjunto do operador G:C? — C? definido por 
G(x, y,z) = [2x + (1 — dy, (3 + 2i)x — 4iz, 2ix+ (4 — 3i)y — 3z] 


Começamos calculando a matriz B que representa G na base canônica de Ce, depois, tomamos a transposta conjugada 
B* de B, como segue. 


2 l-i 0 2 3-2; —2i 
B= |3+2i 0 —4i e, então, B*= |1+i 0 4+ 3i 
2i 4-3i —3 0 4i =3 


Assim, G* (x, y, z) = [2x + (3 — 2i)y — 2iz, (1 + i)x + (4+ 3i)z, 4iy — 3z]. 


13.3 Demonstre o Teorema 13.3. Seja ġ um funcional linear de um espaço com produto interno V de dimensão 
finita. Então existe um único vetor u € V tal que ġ(v) = (v, u}, para cada v € V. 


Seja {w}, ..., W,) uma base ortonormal de V. Definimos 


u=4(wi)w + A(wa)m ++ A(wa)w, 


Seja à o funcional linear de V definido por à(v) = (v, u), para cada v € V. Então, para i = 1, ..., n, 


û(w;) = (wu) = (wi Awi)my +: + Alma) = d(w;) 
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Como à e & coincidem nos vetores da base, obtemos ú = q. 

Suponha, agora, que w’ seja um outro vetor de V tal que ġ(v) = (v, u’), para cada v E€ V. Então (v, u) = (v,u'), ou 
(v, uu”) = 0. Em particular, isso vale para o vetor v = u — u’, ou seja, (u — u’, u—u”) = 0. Disso decorre que 
u—u = Q e u = u'. Assim, o vetor u é único, como queríamos mostrar. 


13.4 Demonstre o Teorema 13.1. Seja 7 um operador linear de um espaço vetorial com produto interno V de 
dimensão finita. Valem as afirmações a seguir. 


(a) Existe um único operador linear T* de V tal que 
(T(u), v) = (u, T*(v)), para quaisquer u, v € V. 


(b) Se A é a representação matricial de T em relação a uma base ortonormal § = {u,} de V, então a 
representação matricial de T* na base S é a transposta conjugada A* de A. 

(a) Definamos o operador T*. Seja v um vetor arbitrário de V fixado. A aplicação u + (T (u), v) é um funcional 
linear de V. Logo, pelo Teorema 13.3, existe um único vetor v’ € V tal que (T (u), v) = (u, v'), para cada u € V. 
Definimos T* : V — V por T*(v) = v'. Então (T (u), v} = (u, T*(v)), para cada u, v € V. 

Mostremos que T* é linear. Dados u, v; E V,e a,b € K, quaisquer, 


(u, T*(av +bv)) = (T(u), avı + bu) = ā(T(u), vi) + b(T (u), v) 


= a(u, T*(v1)) + b(u, T*(0,)) = (u,aT*(v) + bT*(0,)) 
Como isso é válido para cada u € V, temos T*(av, + bv) = aT*(v,) + bT* (v). Assim, T* é linear. 


(b) As matrizes A = [a] e B = [b] que representam T e T*, respectivamente, na base S são dadas por q; = (T (u;), u;) 
e b; = (T*(u;),u;) (Problema 13.67). Logo, 


bi; = (T*(u;), u;) = (u;, T*(u;)) = (T(u;),u;) = aj 
Assim, B = A*, como queríamos mostrar. 
13.5 Demonstre o Teorema 13.2. 
© (+= +T üi) (Tn)* = T¥TŤ, 
Gi) (kT)* = ÁTS, (iv) (T*)* =T. 
© Dadosu,v e V, 


(Ch + To) (10), v) = (Ti (u) + Tou), v) = (Ti (u), 0) + (Tou), v) 
= (u, Ti(v)) + (u, T3 (v)) = (u, Ti(v) + T3(v)) 


Pela unicidade do adjunto, resulta (T) + T5)* = TE + TX. 
(ii) Dados u, v € V, 


(KT) (u), v) = (kT (u), v) = k(T (u), v) = k(u, T*(v)) = (u, kT*(v)) = (u, (KT*)(v)) 


A unicidade do adjunto implica (kT)* = kT*. 
Gii) Dados u, v € V, 


(MT) (1), v) = (MT (u)), v) = (To(u), T¥(v)) 


A unicidade do adjunto implica (T, T})* = TT. 
(iv) Dados u, v € V, 


(T*(u), v) = (v, T*(u)) = (T (v), u) = (u, T(v)) 


A unicidade do adjunto implica (T*)* = T. 
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13.6 Mostre que (a)/* =7, (b)0* = 0. 
(a) Dadosu,v E V, (I(u), v) = (u, v} = (u, I(v)); logo, I* = I. 
(b) Dados u, v € V,(0(u), v) = (0, v) = 0 = (u, 0) = (u, 0(v)); logo, 0* = 0. 


13.7 Seja T invertível. Mostre que (T7!)* = (T*)!. 


I = I* = (TT })* = (T7!)*T*; portanto, (T71)* = (T*) | 


13.8 Sejam T um operador linear de V e W um subespaço T-invariante de V. Mostre que W+ é invariante por T*. 
Sejau € WŁ. Se w € W, então T(w) € W e, portanto, (w, T*(u)) = (T (w), u) = 0. Logo, T* (u) € WŁ, já que 
é ortogonal a cada w € W. Assim, W+ é invariante por T*. 
13.9 Seja T um operador linear de V. Mostre que cada uma das condições seguintes implica T = 0. 
G (T(u),v) = 0, para quaisquer u, v € V. 
(ii) V é um espaço complexo e (T (u), u) = 0, para cada u € V. 
Gii) V é autoadjunto e (T (u), u) = 0, para cada u € V. 


Dê um exemplo de um operador T de um espaço real V tal que (T (u), u) = O valha para cada u € V, mas 
T #0. [Ou seja, (ii) não vale em espaços reais V.] 


(i) Tomando v = T(u), temos (T (u), T(u)) = 0 e, portanto, T(u) = 0, para cada u € V. Assim, T = 0. 


(ii) Por hipótese, (T(v +w), v+ w) = 0 para quaisquer v,w € V. Expandindo e usando (T(v),v) =0 e 
(T (w), w) = 0, obtemos 


(T(v),w) + (T(w), v) =0 (1) 


Observe que w é arbitrário em (1). Substituindo w por iw e usando (T(v), iw) = (T(v),w) = —(T(v),w) e 
(T(iw), v} = (iT (w), v) = (T(w), v}, obtemos 


Dividindo por i e somando com (1), resulta (T(w), v} = 0 para quaisquer v, w, € V. Por (1), T = 0. 


(iii) Por (ii), a afirmação vale em espaços complexos, portanto, resta provar a afirmação no caso real. Expandindo 
(T(v+w), v+w) =0, novamente obtemos (1). Como T é autoadjunto e o espaço é real, temos 
(T(w), v} = (w, T(v)) = (T(v), w). Substituindo isso em (1), resulta (T (v), w} = 0, para quaisquer v, w € V. 
Por (i), T = 0. 


Como um exemplo, considere o operador linear T de R? definido por T(x, y) = (y, —x). Então, (T (u), u) = 0, 
para cada u € V, mas T Æ 0. 


Operadores e matrizes ortogonais e unitários 


13.10 Demonstre o Teorema 13.6. As condições seguintes sobre um operador U são equivalentes. 
() U* = U7! isto é, U é unitário. Gi) (U(v), U(w)) = (u,w). Gi) [U w) = |/vl| 
Suponha que (i) valha. Então, dados quaisquer v, w, € V, 


(U (v), U(w)) = (v, U*U(w)) = (o, I(w)) = (u,w) 


Assim, (i) implica (ii). Suponha que (ii) valha. Então 


IUWI = VU), U) = vv, 0) = llel 


Assim, (ii) implica (iii). Resta mostrar que (iii) implica (i). 
Suponha que (iii) valha. Então, para cada v € V, 


(U*U(v)) = (U (v), U(v) = (v, v) = (v), v) 


Logo, ((U*U — I)(v), v) = 0, para cada v € V. Como U*U — I é autoadjunto (demonstre), pelo Problema 13.9 
temos que U*U — I = 0 e, portanto, U*U = I. Assim, U* = U™!, como queríamos provar. 


13.11 


13.12 
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Sejam U um operador unitário (ortogonal) de V e W um subespaço de V invariante por U. Mostre que W+ 
também é invariante por U. 


Como U é não singular, U(W) = W, de modo que, para cada w € W, existe algum w € W tal que U(w) = w. 
Seja, agora, v € WŁ. Então, para cada w € W, 


(U (v), w) = (U(v), U(w)) = (vw) =0 


Assim, U(v) pertence a W+. Dessa forma, W+ é invariante por U. 


Demonstre o Teorema 13.9. A matriz de mudança de base de uma base ortonormal (u,, ..., u,) para uma 
outra base ortonormal é unitária (ortogonal). Reciprocamente, se P = la, é uma matriz unitária (ortogonal), 


então os vetores u; = >»; aju; formam uma base ortonormal. 


Seja (v,) uma outra base ortonormal e suponha que 
v=bautbou+- bat, i= 1,...,7 (1) 
Como {v;} é ortonormal, 


dj = (Ui, vj) = baba F bab a oei binbjn (2) 
Seja B = [b,] a matriz de coeficientes em (1). (Então B” é a matriz de mudança de base de (u,) para (v,).) Então 
BB* = [c;], com c; = baba H bbz Hed binDp- Por (2), temos c; = ô; e, portanto, BB* = I. Dessa forma, B e, 
portanto, B* é unitária. 

Falta provar que {u; } é ortonormal. Pelo Problema 13.67, 


(ui, ZA = Q;M; + Az; +: F anian — (C; C;) 


onde C, denota a i-ésima coluna da matriz unitária (ortogonal) P = [a;]. Como P é unitária (ortogonal), suas colunas são 


ortonormais, portanto, (u}, u’ 


É A; ={C; C) = dj Assim, (u; + é uma base ortonormal. 


Operadores simétricos e formas canônicas em espaços euclidianos 


13.13 


13.14 


13.15 


Seja T um operador simétrico. Mostre que (a) o polinômio característico A(t) de T é um produto de polinô- 
mios lineares (sobre R) e que (b) T tem algum autovetor não nulo. 


(a) Seja A a matriz que representa T nalguma base ortonormal de V; então A = A”. Seja A(t) o polinômio característico 
de A. Vendo A como um operador autoadjunto complexo, o Teorema 13.4 garante que todos autovalores de A são 
reais. Assim, 


AÇ) = (t= A)(t— 40) ---(t— Aa) 


em que todos os 2, são reais. Em outras palavras, A(t) é um produto de polinômios lineares sobre R. 


(b) Por (a), T tem pelo menos um autovalor (real). Assim, T tem algum autovetor não nulo. 


Demonstre o Teorema 13.11. Seja T um operador simétrico de um espaço com produto interno real V de 
dimensão finita. Então existe uma base ortonormal de V constituída por autovetores de T. (Logo, T pode ser 
representado por uma matriz diagonal em relação a alguma base ortonormal.) 


A demonstração é por indução na dimensão n de V. Se dim V = 1, a afirmação do teorema é válida trivialmente. Supo- 
nha, então, que dim V = n > 1 e que o teorema seja válido para operadores simétricos de espaços de dimensão n — 1. 
Pelo Problema 13.13, existe algum autovetor não nulo v, de T. Seja Wo espaço gerado por v, e seja u, um vetor unitário 
de W, por exemplo, u, = v1/ |v; |. 

Como v, é um autovetor de T, o subespaço W de V é invariante por T. Pelo Problema 13.8, W é invariante por T* = T. 
Assim, a restrição Î deTaW! éum operador simétrico. Pelo Teorema 7.4, temos V = W & w+, Logo, Wi =n-—1, 
já que dim W = 1. Por indução, existe uma base ortonormal (1, ..., u,) de W+ consistindo de autovetores de Te, por- 
tanto, de T. Entretanto, temos (u su) = 0, para i = 2, ..., n, já que u; € W+. Dessa forma, fu, U, ..., U, } É um conjunto 
ortonormal consistindo em autovetores de T. O teorema está demonstrado. 


Seja q(x, y) = 3x? — 6xy + 11y’. Encontre uma mudança de coordenadas ortogonal (substituição linear) 
que diagonalize a forma quadrática q. 


ELJ ÁLGEBRA LINEAR 


13.16 


Calculamos a matriz simétrica A que representa q e seu polinômio característico A(t), como segue. 
3 —3 2 2 
=|. e A(t) =P- tr(A) t+ |A| =Ê — 14t +24 = (t — 2)(t — 12) 


Os autovalores são À = 2 e À = 12. Logo, a forma diagonal de q é 
a(s, t) = 28º + 122 


(em que usamos novas variáveis s e f). A mudança de coordenadas ortogonal correspondente é obtida por meio de um 
conjunto ortogonal de autovalores de A. 
Subtraímos À = 2 das entradas diagonais de A para obter a matriz 


| correspondente a sl ou x—3y=0 


m=| —3x+9y = 0 


=3 
Uma solução não nula é u, = (3, 1). Em seguida, subtraímos ) = 12 das entradas diagonais de A para obter a matriz 


—9x — 3y = 0 


ou — 3x-y=0 
=3x=— »y=0 4 


M = E E correspondente a 


Uma solução não nula é u, = (-1, 3). Normalizamos u, e u, para obter a base ortonormal 
û, = (3/10, 1/10), û, = (—1/V 10, 3/v10) 


Seja P a matriz cujas colunas são à e û,. Então 


= po e D = PAP = P'AP lo | 


1/ViO 3/10 12 


Assim, a mudança de coordenadas ortogonal é 


[51 =7[;] am quit ME dus, 


vão * v10 


Também podemos escrever s e t em termos de x e y usando P~! = P7, como segue. 


3x +y =x + 3y 
s= = —— 


À t 
v10 v10 


Demonstre o Teorema 13.12. Seja T um operador ortogonal de um espaço com produto interno real V. Então 
existe uma base ortonormal de V na qual T'é representado por uma matriz diagonal em blocos M do tipo 


M = diag( sed 4 Es o pi pi) 


send, cos0, send,  cos0, 


Seja § = T + T7! = T + T*. Então S* = (T + T*)* = T* +T = S. Assim, S é um operador simétrico de V. Pelo 
Teorema 13.11, existe uma base ortonormal de V consistindo em autovetores de S. Se 2,,..., A, denota os autovalores 
distintos de S, então V pode ser decomposto na soma direta V = V, DV, ® -+ - ®© V, em que V, consiste nos autove- 
tores associados a À;. Afirmamos que cada V, é invariante por T. De fato, dado v € V, temos S(v) = å;v e, portanto, 


To) = (T + TDT (w) = T(T + T!) (v) = TS(v) = T (40) = 4T (v) 


Isso mostra que T (v) € V;e, portanto, V, é invariante por T. Como os V, são ortogonais uns aos outros, podemos restrin- 
gir nossa investigação ao modo pelo qual T atua em cada V, individualmente. 
Num dado V, temos (T + Tv = S(v) = 2;v. Multiplicando por T, obtemos 


(T? -4T +I) (v) =0 (1) 


CarítruLo 13 ° OPERADORES LINEARES EM ESPAÇOS COM PRODUTO INTERNO —— EP 


Consideramos os casos À; = +2 e À; £ +2 separadamente. Se 1, = +2, então (T + IP (v) = 0, o que conduz a 
(T+N(v) = 0, ou T(v) = +v. Assim, T restrito a esse V é I ou —Z. 

Se À; # +2, então T não tem autovetores em V, pois, pelo Teorema 13.4, os únicos autovalores de T são 1 e —1. Dessa 
forma, para v Æ 0, os vetores v e T(v) são linearmente independentes. Seja W o subespaço gerado por v e T(v). Então W 
é invariante por T, pois, usando (1), obtemos 


T(Tw)) = T? (v) = 4T (v) -vE W 


Pelo Teorema 7.4, V; = W W+. Além disso, pelo Problema 13.8, W+ também é invariante por T. Assim, podemos de- 
compor V, na soma direta de subespaços bidimensionais W, onde os W, são ortogonais uns aos outros e cada W, é inva- 
riante por T. Assim, agora podemos restringir nossa investigação ao modo pelo qual T age em cada W, individualmente. 
Como T? — 4;T + I = 0, o polinômio característico A(t) de T agindo em W,é Al = = At+L Assim, o determi- 
nante de Té 1, que é o termo constante de A(t). Pelo Teorema 2.7, a matriz A que representa T agindo em W, em relação 
a alguma base ortonormal de W, deve ser da forma 


cos0 —senĝð 
sen 0 cos 0 


A união das bases dos vários W, nos dá uma base ortonormal de V, e a união das bases dos V, dá uma base ortonormal de 
V, na qual a matriz que representa T é da forma procurada. 


Operadores normais e formas canônicas em espaços unitários 


13.17 Decida se a matriz dada é normal ou não. 


loi i g 
(a) dA O E pal 


amei) ado 


Como 44* £ A*A, a matriz A não é normal. 


jl i 1 1 2 2+2i 1 1 1 i 
* 2 =, ss * 
Wea li EAE pr 6 BE al palena 


Como BB* = B*B, a matriz B é normal. 


13.18 Seja T um operador normal. Prove as afirmações dadas. 


(a) Tw) = 0 se, e só se, T*(v) = 0. (b)T — AI é normal. 
(c) Se T(v) = Av, então T* (v) = Av; logo, cada autovetor de T é, também, um autovetor de T*. 


(d) Se T(v) = 2v e T(w) = bw, com 4, Æ A, então (v, w) = 0; isto é, autovetores de T associados a 
autovalores distintos são ortogonais. 


(a) Mostramos que (T (v), T(v)) = (T* (v), T*(v)): como segue. 
(T(v), T(v)) = (v, T*T(v)}) = (v, TT*(v)) = (T*(v), T*(v)) 


Logo, por [Z] da definição de produto interno na Seção 7.2, vale (a). 
(b) Mostramos que T — AT comuta com seu adjunto. 


(T =AD(T = At = (T — A) (T* = AI) = TT* = AT* = AT + 221I 
= T*T — ÀT — AT* + AAI = (T* — AD) (T — A1) 
= (T — AI)*(T — 11) 


Assim, T — ÀI é normal. 
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13.20 


(c) SeT(v) = 2v, então (T — AI) (v) = 0. Por (b), T — AI é normal, portanto, por (a), temos (T — AI)* (v) = 0. Logo 
(T* — 2I) (v) = 0;e, assim, T* (v) = du. 


(d) Mostramos que 2, (v, w} = 4, (v, w): como segue. 
2i (v, w) = (41v, w) = (T(v), w) = (v, T*(w)}) = (v, 2w) = %2 (0, w) 


Como À, Æ 43; obtemos (v, w) = 0. 


Demonstre o Teorema 13.13. Seja T um operador normal de um espaço com produto interno complexo V de 
dimensão finita. Então existe uma base ortonormal de V constituída por autovetores de T. (Assim, T pode 
ser representado por uma matriz diagonal em relação a alguma base ortonormal.) 


A demonstração é por indução na dimensão n de V. Se dim V = 1, a afirmação do teorema é válida trivialmente. Supo- 
nha, então, que dim V = n > 1 e que o teorema seja válido para operadores normais de espaços complexos de dimensão 
n — 1. Como V é um espaço vetorial complexo, T tem, ao menos, um autovalor e, portanto, um autovetor não nulo v. 
Seja W o subespaço de V gerado por v e seja u, um vetor unitário de W. 

Como v é um autovetor de T, o subespaço W é invariante por T. Contudo, v também é um autovetor de T*, pelo Proble- 
ma 13.18; logo, W também é invariante por T*. Pelo Problema 13.18, W+ é invariante por T** = T. O resto da demons- 
tração é idêntico à última parte da demonstração do Teorema 13.11 (Problema 13.14). 


Demonstre o Teorema 13.14. Seja T um operador qualquer de um espaço com produto interno complexo 
V de dimensão finita. Então T pode ser representado por uma matriz triangular em relação a alguma base 
ortonormal de V. 

A demonstração é por indução na dimensão n de V. Se dim V = 1, a afirmação do teorema é válida trivialmente. Supo- 
nha, então, que dim V = n > 1 e que o teorema seja válido para operadores de espaços complexos de dimensão n — 1. 
Como V é um espaço vetorial complexo, T tem, ao menos, um autovalor e, portanto, um autovetor não nulo v. Seja W o 
subespaço de V gerado por v e seja u, um vetor unitário de W. Então u, é um autovetor de T e, digamos, T(u,) = aus. 
Pelo Teorema 7.4, V = W & W+. Denotemos por E a projeção ortogonal de V sobre W+. Claramente, W+ é invariante 
pelo operador ET. Por indução, existe uma base ortonormal {u,, ..., u,) de Wh+ tal que, para i = 2, ..., n, 


ET (u;) = apu +3 U3 ++ Ait; 
(Observe que (u,, 45, ..., U„} é uma base ortonormal de V.) Como E é a projeção ortogonal de V sobre W+; decorre que 
T(u) = am + anu ++ au; 


para i = 2,..., n. Isso, com T(u,) = a,u,, dá o resultado procurado. 


Problemas variados 


13.21 


Demonstre o Teorema 13.10b. Seja P um operador. As afirmações seguintes são equivalentes. 
G) P = T?, para algum operador autoadjunto T. 
(ii) P é não negativo, isto é, P = S*S, para algum operador S. 
Gii) P é autoadjunto e (P(u),u) > 0, para cada u € V de V. 
Suponha que (i) valha, ou seja, que P = T?, com T = T*. Então P = TT = T*T e, portanto, (i) implica (ii). Suponha, 
agora, que (ii) valha. Então P* = (S*5)* = S*9** = S&S = Pe, portanto, P é autoadjunto. Além disso, 
(P(u),u) = (SES(u),u) = (S(u), S(u)) > 0 


Assim, (ii) implica (iii) e resta provar que (iii) implica (i). 

Suponha que (iii) valha. Como P é autoadjunto, existe uma base ortonormal {u}, ..., u„} consistindo em autovetores de 
P; digamos que P(u;) = A;u;. Pelo Teorema 13.14, os 2, são reais. Usando (iii), mostremos que os 4; não são negativos. 
Para cada i, temos 


0 <(P(u),u) = Qu Ui) = Au; ui) 


Assim, (u;,4;) > 0, o que força 2; > 0, como queríamos. Em vista disso, VEN é um número real. Seja T o operador 


linear definido por 


T(u;) = V jus, comi=1,..n 


CarítruLo 13 ° OPERADORES LINEARES EM ESPAÇOS COM PRODUTO INTERNO —— 399 q 


Como T é representado por uma matriz diagonal real na base ortonormal (u,), decorre que T é autoadjunto. Além disso, 
para cada i, 


T’ (u;) z T( vu) — VAT (i) = Viiv Zu; = Au; = P(u;) 


Como os valores de T” e P coincidem numa base de V, resulta T = P. O teorema está demonstrado. 


OBSERVAÇÃO O operador T da demonstração é o único operador positivo tal que P = T’, denominado raiz 
quadrada positiva de P. 


13.22 


13.23 


Mostre que todo operador T é a soma de um operador autoadjunto e de um operador antiadjunto. 


Tomamos S = } (T + T*)e U = } (T — T*). Então T = § + U, com 


S* 
Ut=| 


Assim, S é autoadjunto e T é antiadjunto. 


Prove. Seja T um operador linear qualquer de um espaço com produto interno V de dimensão finita. Então T 
é um produto de um operador unitário (ortogonal) U e um único operador positivo P, ou seja, T = UP. Além 
disso, se T for invertível, então U também é determinado de maneira única. 


Pelo Teorema 13.10, T*T é um operador não negativo e, portanto, existe um (único) operador não negativo P tal 
que P? = T*T (Problema 13.43). Observe que 


IPCI? = (PC), P) = (P (v), v) = (T*T (0), v) = (TC), T(v)) = ITO? (1) 


Consideremos agora, separadamente, os casos de T ser ou não invertível. 
Se T é invertível, tomamos U = PT-! e mostramos que Ü é unitário, como segue. 


Û* = (PT!)* = T" P* = (T*)'P e UrU=troy'peri=(rty qem =I 


Assim, Ü é unitário. Agora tomamos U = ÜŪ-!. Então U é também unitário e T = UP, como queríamos. 
Para demonstrar a unicidade, supomos que T = U,P,, com U, unitário e P, não negativo. Então 


T*T = PšUšUPo = PoIP = P3 


Mas a raiz quadrada positiva de T*T é única (Problema 13.43), de modo que P, = P. (Observe que a invertibilidade de 
T não foi usada na demonstração da unicidade de P.) Agora, sendo T invertível, (1) garante que P também é invertível. 
Multiplicando U,P = UP à direita por P-! resulta U, = U. Assim, também U é único se T for invertível. 

Suponha, agora, que T não seja invertível. Seja W a imagem de P, isto é, W = Im P. Definimos U,:W — V por 


U (w) = T(v), onde P(w) =w (2) 


Precisamos mostrar que U, está bem definido, isto é, que P(v) = P(v') implica T (v) = T(v'). Isso segue do fato de que 
P(v — v) = 0 é equivalente a ||P(v — v)|| = 0, o que força ||T (v — v)|| = 0, por (1). Assim, U, é um operador bem 
definido. A seguir, definimos U,:W — V. Observe que, por (1), P e T têm o mesmo núcleo. Logo, as imagens de Pe T 
têm a mesma dimensão, isto é, dim (Im P) = dim W = dim (Im T). Consequentemente, W+ e (Im rir também têm a 
mesma dimensão. Seja U, um isomorfismo qualquer de W+ sobre (Im T) E 

A seguir, tomamos U = U, & U}. [Aqui, definimos U como segue. Se v E€ Vev=w+ w,comwe Ww' € Ww- 
então U (v) = U, (w) + U (w').] Ocorre que U é linear (Problema 13.69) e, se v € V e Pw) = w, então, por (2), 


T(v) = U (w) = U(w) = UP(v) 


Assim, T = UP, como queríamos. 
Resta mostrar que U é unitário. Todo vetor x€ V pode ser escrito da forma x= P(v)+w, onde 
w € WŁ. Então U (x) = UP(v) + Us(w”) = T (v) + U,(w), com (T (v), U (w')} = 0, por definição de U,. Também 
(T(v), T(v)) = (P(v), P(v)), por (1). Assim, 
(U(x), UC) = (T(v) + U (w), T) + U>(w)) = (T), T(0)) + (U> (4), Vo (4) 
= (P(v),P(v)) + (w, w) = (P(v) +w, P(v) +w) = (x,x) 


[Também usamos o fato de que (P(v), w'} = 0.] Assim, U é unitário e o teorema está demonstrado. 


UT —————  Árcesra Linear 


13.24 Seja Vo espaço vetorial dos polinômios sobre R com o produto interno definido por 


1 


(1,8) = | feto di 


0 


Dê um exemplo de um funcional linear & de V para o qual não valha o Teorema 13.3, ou seja, para o qual 


não exista polinômio A(t) algum tal que ġ( f) = (f,h), para cada f € V. 


Seja ġ:V — R definido por ġ¢( f) = f (0), ou seja, ġ calcula f(t) em O e, portanto, leva f(t) em seu termo constante. 


Suponha que A(t) seja um polinômio tal que 


1 


$f) =f(0) = | FORE) dt 


0 


para cada polinômio f(t). Observe que ġ leva o polinômio 1f(t) em 0, portanto, por (1), 


| (ht) dt = 0 
0 


para cada polinômio f(t). Em particular, (2) deve valer para o polinômio f(t) = th(t), ou seja, 


1 
| PR (t) de= 0 
0 


Essa integral força A(t) a ser o polinômio nulo, portanto, (1) = (f, h) = (,0) = 0 para cada polinômio f(t). Isso 


contradiz o fato de que q não é o funcional nulo. Assim, tal polinômio (f) não existe. 


Problemas Complementares 


Operadores adjuntos 


13.25 Encontre a adjunta da matriz dada. 


5-2 3+7i 3 5 11 
8) Tea a W B-|; E © gsi | 


13.26 Seja T:R? — R? definido por T(x,y,2) = (x +2y, 3x — 4z, y). Encontre T*(x, y, 2). 


13.27 Seja T:Cê — C? definido por T (x,y,z) = [ix + (2+3)y, 3x+(3— i)z, (2 — Si)y + iz) Encontre T*(x, y, z). 


13.28 Para cada funcional linear À de V dado, encontre u € V tal que P(v) = (v, u), para cada v € V. 
(a) ġ:R? — R definido por (x, y, z) = x + 2y — 3z. 


(b) ġ:C@ > C, definido por (x,y,z) = ix + (2 + 3i)y + (1 — 2i)z. 


13.29 Seja T um operador de um espaço V de dimensão finita. Prove que a imagem de T* é o complemento ortogonal do nú- 


cleo de T, ou seja, Im T* = (Nuc T)“. Assim, pos(T) = pos(T*). 
13.30 Mostre que T*T = 0 implica T = 0. 
13.31 Seja Vo espaço vetorial dos polinômios sobre R com o produto interno definido por ( f, g) =hf 


operador derivada de V, ou seja, DỌ) = dfidt. Mostre que não existe operador D* de V tal que (D( f), g 
para quaisquer f,g € V. Assim, D não tem adjunto. 


(Det) t) dt. n 
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Operadores e matrizes unitários e ortogonais 


13.32 


13.33 


13.34 


13.35 


13.36 


13.37 


13.38 


13.39 


Encontre uma matriz unitária (ortogonal) cuja primeira linha seja 
(a) (2/v13, 3/v13), (b) um múltiplo de (1, 1, —i), (c) um múltiplo de (1, —i, 1, ~i). 


Prove que os produtos e as inversas de matrizes ortogonais são ortogonais. (Assim, as matrizes ortogonais formam um 
grupo perante a multiplicação, denominado grupo ortogonal.) 


Prove que os produtos e as inversas de matrizes unitárias são unitárias. (Assim, as matrizes unitárias formam um grupo 
perante a multiplicação, denominado grupo unitário.) 


Mostre que, se uma matriz ortogonal (unitária) é triangular, então ela é diagonal. 


Lembre que as matrizes complexas A e B são unitariamente equivalentes se existir uma matriz unitária P tal que B = 
P*AP. Mostre que essa equivalência é uma relação de equivalência. 


Lembre que as matrizes reais A e B são ortogonalmente equivalentes se existir uma matriz ortogonal P tal que B = 
r . A o = . A . 
P AP. Mostre que essa equivalência é uma relação de equivalência. 


Seja W um subespaço de V. Dado qualquer v € V, escreva v = w + w’, com w € W, w € W+. (Uma tal soma é única 
porque V = W & WŁ) Seja T:V — V definido por T (v) = w — w’. Mostre que T é um operador unitário autoadjunto 
de V. 


Sejam V um espaço com produto interno e U:V — V uma aplicação (não necessariamente linear) sobrejetora que 
preserva o produto interno, ou seja, (U (v), U(w)) = (u, w), para quaisquer v, w € V. Prove que U é linear e, portanto, 
unitário. 


Operadores não negativos e positivos 


13.40 


13.41 


13.42 


13.43 


13.44 


13.45 


13.46 


13.47 


Mostre que a soma de dois operadores não negativos (positivos) é um operador não negativo (positivo). 


Seja T um operador linear de Ve defina f:V x V — K por f (u, v) = (T(u), v}. Mostre que fé um produto interno de 
V se, e só se, T é positivo. 


Seja E uma projeção ortogonal sobre algum subespaço W de V. Prove que kl + E é um operador não negativo (positivo) 
se k > 0(k>0). 


Considere o operador T definido por T(u;) = VAuni =1,...,n,na prova do Teorema 13.10b (Problema 13.21). 
Mostre que T é não negativo e que é o único operador não negativo tal que T? = P. 


Suponha que P seja não negativo e unitário. Prove que P = 7. 
Decida se a matriz dada é não negativa ou positiva. 

1 1 0 i 01 1 1 2 1 12 
(a) (OD. (o , d) , œ) , (D 

1 1 —i 0 -1 0 01 12 21 

. a bl. ; ; : z = 

Prove que uma matriz 2 x 2 complexa 4 = c q |énão negativa se, e só se, (1) A = A* e (ii) a, de |A| = ad — bc são 
números reais não negativos. 


Prove que uma matriz diagonal A é não negativa (positiva) se, e só se, cada entrada diagonal é um número real não 
negativo (positivo). 
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Matrizes autoadjuntas e simétricas 


13.48 


13.49 


13.50 


13.51 


13.52 


13.53 


Dado qualquer operador T, mostre que T + T* é autoadjunto e que T — T* é antiadjunto. 


Seja T autoadjunto. Mostre que T? (v) = 0 implica T(w) = O. Use isso para provar que também T” (v) = 0 implica T(V) 
= 0,comn>o0. 


Seja V um espaço com produto interno complexo. Suponha que (T (v), v) seja real, para cada v € V. Mostre que T é 
autoadjunto. 


Sejam T, e T, operadores autoadjuntos. Mostre que T,T, é autoadjunto se, e só se, T, e T, comutam, isto é, T T, = T,T,. 


Para cada matriz simétrica A dada, encontre uma matriz ortogonal P e uma matriz diagonal D tais que D = P'AP. 


1 2 5 4 7 3 
@ 4= [5 E oal al (o 4= [5 É 


Encontre uma mudança de coordenadas ortogonal X = PX’ que diagonalize cada forma quadrática dada e encontre a 
correspondente forma quadrática diagonal q(x’). 


(a) q(x, y) = 2x? — 6xy + 1072, (b) q(x, y) =x + 8x — 57° 
(b) q(x, y, Zz) = 2x? — 4xy + 5y? + 2xz — 4yz + 27º 


Operadores e matrizes normais 


13.54 


13.55 


13.56 


13.57 


13.58 


13.59 


13.60 


13.61 


13.62 


i 


2 PES ME 
Seja 4 = | in | Verifique que A é normal. Encontre uma matriz unitária P tal que P*AP seja diagonal. Encontre P*AP. 


Mostre que uma matriz triangular é normal se, e só se, é diagonal. 


Prove que se T é um operador normal de V, então ||T(v)|| = ||T*(v)||, para cada v € V. Prove que a recíproca vale em 
espaços com produto interno complexos. 


Mostre que operadores autoadjuntos, antiadjuntos e unitários (ortogonais) são normais. 


Seja T um operador normal. Prove as afirmações dadas. 
(a) Té autoadjunto se, e só se, os autovalores de T são números reais. 


(b) Té unitário se, e só se, os autovalores de T têm valor absoluto 1. 


(c) Té não negativo se, e só se, os autovalores de T são números reais não negativos. 

Seja T um operador normal. Mostre que T e T* têm o mesmo núcleo e a mesma imagem. 

Sejam T, e T, operadores normais que comutam. Mostre que T, + T, e T,T, também são normais. 

Seja T, um operador normal que comuta com um operador T,. Mostre que T, também comuta com o operador T%. 
Demonstre a afirmação seguinte. Sejam 7, e T, operadores normais de um espaço com produto interno complexo V 


de dimensão finita. Então existe uma base ortonormal de V consistindo de autovetores de T, e T,. (Assim, T, e T, são 
simultaneamente diagonalizáveis.) 


Isomorfismos de espaços com produto interno 


13.63 


Seja S = (um, ..., u,) uma base ortonormal de um espaço com produto interno V sobre K. Mostre que a aplicação 
v= [o] s é um isomorfismo (de espaços com produto interno) de V sobre K". (Aqui, [v]; denota o vetor de coordenadas 
de v na base S.) 


CarítruLo 13 ° OPERADORES LINEARES EM ESPAÇOS COM PRODUTO INTERNO — 403 9 


13.64 Mostre que dois espaços com produto interno Ve W sobre K são isomorfos se, e só se, Ve W têm a mesma dimensão. 


13.65 Sejam (u,....,u,) e (ul,...,u!,) bases ortonormais de Ve W, respectivamente. Seja T:V — W a transformação linear 
definida por T(u,) = ui, para cada i. Mostre que T é um isomorfismo. 


13.66 Seja V um espaço com produto interno. Vimos que cada u € V determina um funcional linear ú do espaço dual V* pela 
definição ú(v) = (v, u}, com v € V. (Ver o texto que precede o Teorema 13.3.) Mostre que a aplicação u +» ú é linear 
e não singular e, portanto, um isomorfismo de V sobre V*. 


Problemas variados 


13.67 Seja (u,, ..., u„} uma base ortonormal de V. Prove as afirmações dadas. 
(a) (am + azu + + apup, bu + bau ++: + baum) = aibi + ab, +: +ã 


nºn 
(b) Seja A = [a,] a representação matricial de T: V — V na base (u,). Então a, = (T(u;), u;). 


13.68 Mostre que existe uma base ortonormal (u,, ..., 4,) de V consistindo de autovetores de T se, e só se, existem projeções 
ortogonais E,, ..., E, e escalares 4,,...,, tais que 


G) T = 4E + +ÃE, (Gi) E+- +E, =I, Gii) E;E, =0 com i£j 
13.69 Suponha que V =UBWequeT;:U — V e T,:W — V sejam operadores lineares. Mostre que T = T, & T, também 
é um operador linear. Aqui, T é definido como segue. Se v € V,comv=utweucU, we W, então 


T(v) = Ti(u) + T, (w) 


Respostas dos Problemas Complementares 


Notação: [R;; Rz; ...; R,]denota uma matriz de linhas R}, R,, ..., R 


n 


13.25 (a) [5424 446 3-7i, 8-5 dd) Da (© [l,2; 1,3] 


13.26 T*(x,y,z) = (x + 3y, 2x+z, —4y) 


13.27 T*(x,y,z) = [—ix + 3y, (2-— 3i)x + (2 + 5i)z, (3 + i)y — iz] 


13.28 (a) u=(1,2,-3), (b) u=(-i, 2-3, 1+2i) 


13.32 @ (1/VI3)[2,3; 3,-2, 6 0/9, Lois 1+i —1], 
(o) dl, =i 1-i; v2i, —-V2, 0; 1, =i, -1 +i] 


13.45 Somente (a) e (e) são não negativas; somente (e) é postiva. 


13.52 (aeb) P = (1/V5)[2,—1; 1,2}, (O) P=(1//10)[3,-1; 1,3] 
(a) D=[2,0; 0,-3], (b) D=[7,0; 0,—3], (O) D= [8,0; 0,-2] 


13.53 (a) x= (3x =))/V10, y= (x +3y)/v10; (b) x= (2x —y')/ v5, y= (x +2y)/v5; 
(0) x=x/V3+y/v2+7/V6, y=x/vV3 27/6, z=x V3 — y /V2 +z /vV6; 
(a) q(x') = diag(1,11); (b) q(x’) = diag(3,—7); (© q(x) = diag(1,17) 


13.54 (a) P= (1/V2)[l,—1; 1,1], P*AP = diag(2 +i, 2-— i) 


Apêndice A 


Produtos Multilineares 


A.1 INTRODUÇÃO 


O material deste apêndice é muito mais abstrato do que o apresentado até aqui. Em vista disso, omitimos muitas 
demonstrações. Também motivamos este material com a observação seguinte. 
Seja S uma base de um espaço vetorial V. O Teorema 5.2 pode ser reescrito como segue. 


Teorema 5.2 Sejag:S — V a aplicação inclusão de S em V. Então, dado qualquer espaço vetorial U e dada qual- 
quer aplicação f:S — U, existe uma única transformação linear f*:V — U tal que f = f*o g. 


Uma outra maneira de enunciar o fato de que f = f*- g é dizer que o diagrama na Figura A-l(a) é comutativo. 


V T=vew E=NV 
N w i 
“M e N te N e 
g sf g sf £ sf 
". ir N 
a a : a 
S— >U VxW———— >U V——— >U 
S S J 
(a) (b) (c) 
Figura A-1 


A.2 APLICAÇÕES BILINEARES E PRODUTOS TENSORIAIS 
Sejam U, V, W espaços vetoriais sobre um corpo K. Dizemos que uma aplicação 
fiVxWwW>5>U 


é bilinear se, para cada v € V, a aplicação f,:W — U, definida por f,(w) = f(v,w), é linear e se, para cada 
w € W, a aplicação f,:V — U, definida por f(v) = f (v, w), também é linear. 

Assim, fé linear em cada uma de suas duas variáveis. Observe que f é análoga a uma forma bilinear, exceto que 
os valores da aplicação f estão num espaço vetorial U em vez do corpo K. 


DEFINIÇÃO Sejam Ve W espaços vetoriais sobre o mesmo corpo K. O produto tensorial de Ve W é um espaço 
vetorial T sobre K junto com uma aplicação bilinear g : V x W — T, denotada por g(v, w) = v& w, com a 
propriedade que indicamos por (*), como segue. Dados qualquer espaço vetorial U sobre K e qualquer aplicação 
bilinear f : V x W > U, existe uma única transformação linear f*:T — U tal que f*og =f. 


O produto tensorial (T, g) [ou, simplesmente, T, quando g estiver subentendido] de V e W é denotado por 
V W eo elemento v & w é denominado tensor de v e w. 
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Outra maneira de enunciar a condição (*) é dizer que o diagrama da Figura A-1(b) é comutativo. A existência 
de uma tal transformação linear única f* é denominado “Princípio da Aplicação Universal”. Conforme ilustra a 
Figura A-1(b), a condição (*) também diz que qualquer aplicação bilinear f:V x W — U “fatora pelo” produto 
tensorial T = V & W. A unicidade em (*) implica que a imagem de g gera T, ou seja, ge((V9 w}) = T. 


Teorema A.1 (Unicidade do Produto Tensorial) Sejam (T, g) e (T”, g’) produtos tensoriais de V e W. Então 
existe um único isomorfismo 4: T — T'tal que hg = g’. 


Demonstração. Como T é um produto tensorial e g :V & W — T' é bilinear, existe uma única transformação 
linear h:T — T'tal que Ag = g'. Analogamente, como T’ é um produto tensorial e g: V & W — T' é bilinear, 
existe uma única transformação linear h’: T” — T tal que h'g' = g. Usando hg = g', obtemos h'hg = g. Além 
disso, como T é um produto tensorial e g: V & W — T é bilinear, existe uma única transformação linear h* : T — T 
tal que h*g = g. No entanto, 1,g = g e, portanto, h'h = h* = 1,. Analogamente, hh’ = 1,. Assim, h é um isomor- 
fismo de T sobre T”. 


Teorema A.2 (Existência do Produto Tensorial) Existe o produto tensorial T = V & W de espaços vetoriais V 
e W sobre K. Sejam (v,, ..., v,) uma base de Ve {w}, ..., w,) uma base de W. Então os mn vetores 


Um 


ow (i=1,..smj=1,...,n) 


formam uma base de T. Assim, dim T = mn = (dim V)(dim W). 


Esboço de Demonstração. Sejam (v,, ..., v,) uma base de Ve {w}, ..., w,) uma base de W. Considere os mn 
símbolos (tj b= iam] =l; ;n Sé To espaço vetorial Seado pelos t,, ou seja, T consiste em todas as 
combinações sis E t; com enekes em K. (Ver Problema 4.137.) 

Sejamv E€ V e w € W. dados, digamos, 


ij? 


V = QV Fav Fie F Aann e w= biw + bw + + bmWm 


Seja g:V x W — T definida por 
sl w) =) > ab; 
i j 


Então g é bilinear (demonstre). 
Seja f: V x W — U bilinear. Como os t, formam uma base de T, o Teorema 5.2 (enunciado no início da se- 
ção) garante que existe uma única transformação linear f*:T — U tal que f* (t; yj) =f (v;, w). Então, para 


Da ew= D temes 


Sam Dm) = DD abf (ww RM t;=F(e(v, w)). 


Logo, f = f“g, onde f* é a transformação linear exigida na definição. Assim, T é um produto tensorial. 
Sejam, agora, {v}, ..., Un} uma base qualquer de Ve {w}, ..., Wn} uma de W. Sejam v € V ew € W dados, 
digamos, 


MR A / 1 / / 
V= AV Fe FAnn e w=bw+H:+DbaWm 


Então 


v&w = g(v, w) Au 2 avig 2 aibi( (v; Ow) 


Assim, os elementos v; & w; geram T. Há mn desses elementos, que não podem ser linearmente dependentes por- 
que (t,) é uma base de Te, Dono, dim T = mn. Assim, os v; & w; formam uma base de T. 
Vejamos dois exemplos concretos de produtos tensoriais. 


Exemplo A.1 Sejam V o espaço vetorial dos polinômios P, _ (x)e W o espaço vetorial dos polinômios P, _ (y). 
Assim os elementos a seguir formam bases de V e W, respectivamente. 
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PR E RR É LM 

Em particular, dim V = re dim W = s. Seja To espaço vetorial dos polinômios nas variáveis x e y com base 
{xyi} comi=0,1,...,r—1;j=0,1,...,s—1 

Então T é o produto tensorial V & W pela aplicação 
voy = xry 

Por exemplo, se v = 2 — 5x + 3x? e w= Ty + 47°, então 


vw = l4y + 87° — 35xy — 20xy? + 21x°y + 12x? 


Observe que dim T = rs = (dim V)(dim W). 


Exemplo A.2 Sejam V o espaço vetorial das matrizes m x n sobre um corpo K e W o das matrizes p x q sobre K. 
Suponha que A = [a,] pertença a Ve B a W. Seja T o espaço vetorial das matrizes mp x nq sobre K. Então T é o 
produto tensorial de V e W, em que 4 & B é a matriz em blocos 


aB a,B EA ainB 
AQ&B= [a;;B] — |auB aB > aB 
amb amB amnB 
1 2 2 
Por exemplo, se 4 = É a e B= : 5 a então 


1 2 3 2 4 6 


12 15 18 16 20 24 


Isomorfismos de produtos tensoriais 


Inicialmente, observamos que o produto tensorial é associativo de maneira canônica, como segue. 
Teorema A.3 Sejam U, V, W espaços vetoriais sobre um corpo K. Então existe um único isomorfismo 
(USIV)IW —=>UQ(VEW) 
tal que, para quaisquer u E€ U, vE V, wE W, 
(uD) wm= ug(vew) 


Em vista disso, podemos omitir os parênteses quando tensoriamos um número finito qualquer de fatores. Mais 
precisamente, dados espaços vetoriais V,, V}, ..., V, sobre um corpo K, podemos definir, sem ambiguidade, o pro- 
duto tensorial 


VIVO... Vm 
e, dados vetores v; em V;, podemos formar, sem ambiguidade, o produto tensorial 
VIGA... Q Vm 
Além disso, dado um espaço vetorial V sobre K, podemos definir, sem ambiguidade, o produto tensorial 


QK =V QV 8...8 FV (der fatores) 
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Também temos o isomorfismo canônico 
(S"V) Q (GV) Es, Qy 

Finalmente, vendo K como um espaço vetorial sobre si mesmo, temos o isomorfismo canônico 
KƏV >V 


em que definimos a & v = av. 


A.3 APLICAÇÕES MULTILINEARES ALTERNADAS 


Seja f : V” — U, em que V e U são espaços vetoriais sobre K. [Lembre que V” = V x V x... x V, com r fato- 
res.) 


(1) Dizemos que f é uma aplicação multilinear ou r-linear se f(v,, ..., v,) é linear como função de cada v; separa- 
damente, considerando os demais v, fixados. Isto é, 


Seer ip tree) SS aeg Ue) ES erg Urea) 


em que apenas a j-ésima posição varia. 
(2) Dizemos que a aplicação fé alternada se 
Flw, -.., v.) = 0, sempre que v, = v, comi + j. 


Pode-se mostrar facilmente (demonstre) que se f é uma aplicação multilinear alternada de V’, então 


Dogs pra E SA rs sap U ii) 


Isto é, se trocamos de posição dois vetores, então o valor associado troca de sinal. 


Exemplo A.3 (Determinantes) A função determinante D:M — K do espaço M das matrizes n x n pode ser 
vista como uma aplicação com n variáveis 


D(A) = D(Ri, RB», paira) 


definida nas linhas R}, R,, ..., R, de A. Na Seção 8.15 vimos que, nesse contexto, D é tanto n-linear quanto alternada. 


Precisamos, agora, de mais notação. Denotemos por P = [k,, k,, ..., k,] uma lista de r elementos de 7, = (1,2, 
«ny (uma r-lista). Então utilizamos a notação a seguir, em que os v, denotam vetores e os a; denotam escalares. 


vp = (Vko Vo eo Ve Je ap = Mk Uh, . Ak 


F 


Observe que v, é uma lista de r vetores e ap é um produto de r escalares. 

Suponha, agora, que os elementos de P = [k,, k,, ..., k,] sejam distintos. Então P é uma permutação o, de uma 
r-lista J = [i,, i, ..., 1,] em forma padrão, isto é, tal que i} < i, <-:: < i,. O número dessas listas padrão J de r 
elementos de 7, é o coeficiente binomial 


mam 


[Na Seção 8.4 vimos que sgn(og) = (—1)”», onde mp é o número de inversões que transformam P em J.] 
Seja, agora, A = [a] uma matriz r x n. Dada uma r-lista ordenada J, definimos 


Mi Mi ce Mi, 

“DO di doi 

D(A) = 1 2 r 
a a a 
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Isto é, D(A) é o determinante da submatriz r x r de A cujos índices de coluna pertencem a J. 
A demonstração do teorema principal desta seção (Teorema A.6) necessita de um lema relativo a “embaralha- 
mentos”. 


Lema A.4 Sejam Ve U espaços vetoriais sobre K e f:V” — U uma aplicação r-linear alternada. Sejam v,, v», ..., 
v, vetores de Ve A = la] uma matriz r x n sobre K, comr < n. Para i = 1, 2, ..., r, escrevemos 


Ui = Aj Vi F aiU + + amd 


Então 


f(u, Eag u,) = XO DIAY (vn; Ui,» Aa v;) 
f 


em que a soma é sobre todas as r-listas J = [i,, i, ..., i,] em forma padrão. 
A demonstração é técnica, mas direta. A linearidade de f fornece a soma 


f(u, apogi u,) = X agf (vg) 


K 


em que a soma é sobre todas as r-listas P de {1, ..., n}. Por ser alternada, temos f(v,) = 0, sempre que P tiver algum 
inteiro repetido. Agora, a demonstração utiliza, principalmente, o fato de que quando trocamos a posição dos v, 
para transformar 


f(vp) =f (Vk, Ukg cer vg ) em fy) =f (vi, Viy aag v) 


r 


de tal forma que 1, < --: < 1,, O sinal associado a a, mudará do mesmo modo que o sinal da permutação Op cor- 
respondente muda quando é transformada na permutação identidade por meio de transposições. 
No exemplo, ilustramos o lema com r = 2en = 3. 


Exemplo A.4 Seja f:V? — U uma aplicação multilinear alternada. Sejam v,, v,, vy € V eu, w € V e suponha que 
u=avtawrtav e w= biv + bv + b30 

Considere 
f(u, w) =f (av; + av +azv3, biv, + bzu + b303) 

Usando multilinearidade, obtemos as nove parcelas 


f(u, w) = abi f (v1, 0) + aiba f(v, 02) + aba f (v1, vs) 

+ abi f (v2, v1) + azb f (02, v2) + aba f (02, vs) 

+ azb; f (%3, v1) + asbof (03, 02) + a3b3 f (03, v3) 

(Observe que J = [1,2], J! = [1,3] e J” = [2,3] são as três 2-listas em forma padrão de 1, = {1, 2, 3}.) Como 
fé alternada, temos f(v; v;) = 0; logo, três dessas nove parcelas são iguais a O. Novamente por ser f alternada, temos 


Hu, v) = flv, v). Assim três dos termos podem ser transformados, de tal modo que seus índices formem uma 
2-lista em forma padrão com uma única inversão. Finalmente, obtemos 


f(u,w) = (ab; — ab) f(v, v2) + (ajb; — asby) f (v1, v3) + (azb; — azb2) f (v2, 05) 


a a 
i b; f(v, v2) + f(v, 03) 


a&i 


— as à ds 
bi b; b, b; 


f(v u) + 


que é o conteúdo do Lema A.4. 
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A.4 PRODUTOS EXTERIORES 


Temos a definição a seguir. 


DEFINIÇÃO Sejam V um espaço vetorial de dimensão n sobre um corpo K e r um inteiro tal quel < r < n.O 
produto exterior de potência r de V (ou, simplesmente, produto exterior de V, se o r estiver subentendido) é um 
espaço vetorial E sobre K junto com uma aplicação r-linear alternada g: V” — E, denotada por g(v,, ..., v,) = 
v A... A v, com a propriedade que indicamos por (*), como segue. Dado qualquer espaço vetorial U sobre K 
e qualquer aplicação r-linear alternada f:V” — U, existe uma única transformação linear f*:E > U tal que 
f g=f. 

O produto exterior (E, g) [ou, simplesmente, E, quando g estiver subentendido] de potência r de V é denotado 
por A” V e o elemento v, A ++- A v, é denominado produto exterior dos v,. 

Uma outra maneira de enunciar a condição (*) é dizer que o diagrama da Figura A-1(c) é comutativo. Nova- 
mente, a existência de uma tal transformação linear única f* é denominado “Princípio da Aplicação Universal”. 
Conforme ilustra a Figura A-1(c), a condição (*) também diz que qualquer aplicação r-linear alternada f : V” — U 
“fatora pelo” produto exterior E = A” V. Novamente, a unicidade em (*) implica que a imagem de g gera E, ou 
seja, ger(fv, AA u} = E. 


Teorema A.5 (Unicidade do Produto Exterior) Sejam (E, g) e (E, g’) produtos exteriores de potência r de V. 
Então existe um único isomorfismo h: E > E tal que hg = g. 


A demonstração é análoga à do Teorema A.1, usando o princípio da aplicação universal. 


Teorema A.6 (Existência do Produto Exterior) Existe o produto exterior E = A'V de um espaço vetorial V 
sobre K. Ser >n, então E = (0). Ser = n, então dim E = e ) Além disso, se (v,, ..., v,) é uma base de V, então 
os vetores 

V Nvu, Ac AU 


i) 


coml <i <i, <- <i, <n, formam uma base de E. 
Vejamos um exemplo concreto de produto exterior. 


Exemplo A.5 (Produto vetorial) Considere V = R? com a base canônica fi, j, k}. Seja E = ANV. Observe que dim 
V = 3. Assim, dim E = 3, com baseia j, i^ k, j A k. Identificamos E com Rº pela correspondência 


i=jAk,j=k^i=-i^k,k=i^j 
Sejam u e w vetores quaisquer de V = Rê, digamos, 

u = (a1, 0, a3) = qi + aj +a;k e w= (b1, b3, b3) = bii + bj + bsk 
Então, como no Exemplo A.3, 

u A w = (ab — abi) A j) + (aib; — abi )(i Ak) + (azb; — a3b2)(j Ak) 


Usando a identificação, obtemos 


u ^w = (a,b; — asb;)i — (a;b; — azb, )j + (ab, — ab; )k 
a2 a 
b) b; 


bi b; 


r= 


Assim, esse produto exterior é precisamente o produto vetorial conhecido de R? (ver Seção 1.6). 


Nosso último teorema afirma que é possível “multiplicar” produtos exteriores, o que nos permite formar uma 
“álgebra exterior”, como segue. 


i  Árcesra Linear 


Teorema A.7 Sejam V um espaço vetorial sobre K e r, s inteiros positivos. Existe uma única aplicação bilinear 
NV x NV => AV 


tal que, dados quaisquer vetores u; w, em V, 
(u Acc AU) X (WA AW) SUA e AUAWA o AW, 
Exemplo A.6 Formamos uma álgebra exterior A sobre um corpo K usando variáveis não comutativas x, y e z. Por 
ser uma álgebra exterior, nossas variáveis satisfazem 
xAx=0, yAy=0, zAzZz=0, e yAx=-xAy, zAx=-xAZ, ZAy= VAZ 
Cada elemento de A é uma combinação linear dos oito elementos 
1 x, y, Ze XA} XxAZ, VAZ, XAVAZ 


Multiplicamos dois “polinômios” em A usando a distributividade usual, mas também as condições dadas. Por 
exemplo, 


B3 + 4y — 5x Ay + 6x Az] A [5x — 2y] = 15x — 6y — 20x Ay + 12x Ay Az 
Observe que usamos o fato de que 


4y] A [5x] = 20y Ax = —20x^Ay e  [6xAz]A[|-2y] = —12x Az Ay = 12x ^y ^z 


Apêndice B 


Estruturas Algébricas 


B.1 INTRODUÇÃO 


Neste apêndice definimos estruturas algébricas que ocorrem em quase todas as áreas da Matemática. Em particular, 
definimos corpo, que aparece na definição de espaço vetorial. Começamos com a definição de grupo, que é uma 
estrutura algébrica relativamente simples, com apenas uma operação, e que é usado como um bloco com o qual 
podemos construir muitos outros sistemas algébricos. 


B.2 GRUPOS 


Seja G um conjunto não vazio com uma operação binária, isto é, a cada par de elementos a, b € G está associado 
um elemento ab € G. Dizemos que G é um grupo se os axiomas a seguir forem válidos. 


[G,] Dados quaisquer a, b, c € G, temos (ab)c = a(bc) (associatividade). 
[G,] Existe um elemento e € G, denominado elemento neutro, ou identidade, tal que ae = ea = a, para cada a € G. 


[G,] Para cada a € G, existe um elemento a! € G, denominado inverso de a, tal que aa”! = ala = e. 


Dizemos que um grupo G é abeliano (ou comutativo) se valer a comutatividade, isto é, ab = ba para quaisquer 
a,beG. 

Quando a operação binária é denotada por justaposição, como aqui, dizemos que G é um grupo multiplicativo. 
Às vezes, quando o grupo é abeliano, denotamos a operação binária por + e, nesse caso, dizemos que G é um gru- 
po aditivo. Nesse caso, o elemento neutro é denotado por O e denominado elemento zero, e o elemento inverso de 
a é denotado —a e denominado elemento simétrico ou oposto de a. 

Se A e B são subconjuntos de um grupo G, escrevemos 


AB=(abjaeA,beB) ou A+B=(a+bjlaceA,beB) 


Também escrevemos a em vez de {a}. 

Um subconjunto H de um grupo G é um subgrupo de G se o próprio H formar um grupo com a operação indu- 
zida de G. Se H é um subgrupo de Ge a € G, dizemos que o conjunto Ha é uma classe lateral à direita de H em G 
e o conjunto aH é uma classe lateral à esquerda de H em G. 


DEFINIÇÃO Um subgrupo H de G é um subgrupo normal se a`!Ha CH, para cada a € G. Equivalentemente, H 
é normal se aH = Ha, para cada a € G, isto é, se as classes laterais à esquerda e à direita de H coincidem. 


Observe que cada subgrupo de um grupo abeliano é normal. 


Teorema B.1 Seja H um subgrupo normal de G. Então as classes laterais de H em G formam um grupo com a 
multiplicação de classes. Esse grupo é denominado grupo quociente e denotado por G/H. 
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Exemplo B.1 O conjunto Z dos inteiros forma um grupo abeliano com a adição. (Observe que os inteiros pa- 
res formam um subgrupo de Z, mas não os ímpares.) Denotemos por H o conjunto dos múltiplos de 5, isto é, 
H = {...,—10, —5, 0, 5, 10, ...}. Então H é um subgrupo (necessariamente normal) de Z. As classes laterais de H 
em Z são dadas a seguir. 


+H =H = {...,—10, —5, 0, 5,10,...} 
+H = {...,—9, —4, 1, 6, 11, ...} 


A wI NI =l Ol 
I 

Pp w Ho 
| 


-H= {..., —8, —3, 07,12 quo) 
=3 +H = {..., —7, —2, 3, 8, 13, ...} 
=4+H = {..., —6, —1, 4, 9, 14, ...} 


Dado qualquer inteiro n € Z, ñ = n + H coincide com uma das classes listadas. Assim, pelo teorema precedente, 


Z/H = {0, 1, 2, 3, 4} forma um grupo com a soma de classes laterais. A tabela da adição é dada a seguir. 


+|0 123 4 
0/10 1234 
1|1 2340 
2|2 3401 
313 4012 
414 0123 


Esse grupo quociente é denominado grupo dos inteiros módulo 5, frequentemente denotado por Zs. Analogamente, 
dado qualquer inteiro positivo n, construímos o grupo Z, dos inteiros módulo n. 


Exemplo B.2 As permutações de n símbolos (ver Seção 8.4) formam um grupo com a composição de aplicações, 
denominado grupo simétrico de grau n e denotado por S,. Investigamos S}, cujos elementos são 


2 3 
3 1 
2 
1 


) 


A 
II 
ATTN 
— = 
UN NN 
NU WVU 
wan An 
o] q 
w N 
| | 
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N =e W = 
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= Ww 
i e 
> 
| 
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E o o 03 Q Q 


E E o o o Qi Q 
O |0 € dr h 0 03 


o3 | o3 Qi Q € 01 O 
hil P o q qm bd E€ 
pal P2 o qq 0 € Qı 


(Na tabela, ab é o elemento na linha a e coluna b.) O conjunto H = (c, c4 } é um subgrupo de S}, com classes late- 
rais à direita e à esquerda como segue. 


Classes laterais à direita Classes laterais à esquerda 
H=(e 01 H = {6, 01} 
E = {pi 02} PH = {91,03} 
H4, = (02,03) doH = 102,05) 
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Observe que as classes laterais à direita e à esquerda são diferentes, portanto, H não é um subgrupo normal. 


Uma aplicação f de um grupo G num grupo G’ é denominada homomorfismo (de grupos) se flab) = Hao)f(b), 
para quaisquer a, b € G. (Se f também é uma bijeção, isto é, injetora e sobre, dizemos que f é um isomorfismo e 
que G e G' são isomorfos.) Se f : G — G'é um homomorfismo, então o núcleo de fé o conjunto dos elementos de 
G que f leva no neutro é € G’, ou seja, 


núcleo de f = {a € Glf(a) = e) 
(Como sempre, o conjunto (G) é denominado imagem da aplicação f : G — G') Vale o teorema seguinte. 


Teorema B.2 Seja f. G — G um homomorfismo. Então o núcleo N de f é um subgrupo normal de G e o grupo 
quociente G/N é isomorfo à imagem de f. 


Exemplo B.3 Seja G o grupo dos números reais com a adição e G' o grupo dos números reais positivos com a 
multiplicação. A aplicação f : G — G' definida por fa) = 2º é um homomorfismo, pois 


Fla + b) = 20 = 2º2º = f (a)f (b) 


Em particular, fé uma bijeção, de modo que G e G' são isomorfos. 


Exemplo B.4 Seja G o grupo dos números complexos não nulos com a multiplicação e G' o grupo dos números 
reais não nulos com a multiplicação. A aplicação f : G — G' definida por f(z) = |z| é um homomorfismo, pois 


Jaz) = laz] = lalz] =f) 22) 


O núcleo K de f consiste nos números complexos z do círculo unitário, isto é, tais que |z| = 1. Assim, G/K é isomor- 
fo à imagem de f, ou seja, ao grupo de números reais positivos com a multiplicação. 


B.3 ANÉIS, DOMÍNIOS E CORPOS 


Seja R um conjunto não vazio com duas operações binárias, uma adição, denotada por + e uma multiplicação, 
denotada por justaposição. Dizemos que R é um anel se os axiomas a seguir forem válidos. 


[Rj] Dados quaisquer a, b, c € R, temos (a + b)+ c =a+ (b+c). 

[R$] Existe um elemento O € R, denominado elemento zero, ou nulo, tal que a + 0 = 0 + a = a, para cada a € R. 

[R$] Para cada a € R, existe um elemento —a € R, denominado oposto, ou simétrico, de a, tal que a + (-a) = (~a) 
+a=0. 

[R,] Dados quaisquer a, b € R, temos a + b =b + a. 

[R;] Dados quaisquer a, b, c E R, temos (ab)c = a(bc). 

[R$] Dados quaisquer a, b, c € R, temos 


(1) a(b + c) = ab + ac e (1) (b + c)a = ba + ca. 


Observe que os axiomas [R ;] a [R,] podem ser resumidos dizendo que R é um grupo abeliano na adição. 

A subtração é definida em R por a — b = a + (-b). 

Pode ser mostrado (Problema B.25) que a0 = 0a = 0, para cada a € R. 

Dizemos que um anel R é comutativo se ab = ba, para quaisquer a, b € R. Dizemos que R é um anel com 
unidade se existir um elemento não nulo 1 € R tal que al = la = a, para cada a € R. 

Um subconjunto § de um anel R é um subanel de R se o próprio S formar um anel com as operações induzidas 
de R. Observamos que S é um subanel de R se, e só se, a, b € S implicaa—b ES e abes. 

Dizemos que um subconjunto 7 de R é um ideal à esquerda de R se (i)a — b € I, para quaisquer a, b € Te (ii) 
ra € I, para quaisquer r € R, a € I. Observe que um ideal à esquerda 7 de R também é um subanel de R. Analoga- 
mente, definimos ideais à direita e ideais bilaterais. Claramente, todos os ideais de anéis comutativos são bilate- 
rais. O termo ideal significa ideal bilateral, salvo menção explícita em contrário. 
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Teorema B.3 Seja I um ideal (bilateral) de um anel R. Então as classes laterais (a + 7 |a € R} formam um anel 
com a adição e multiplicação de classes. Esse anel é denominado anel quociente e denotado por R/T. 


Seja R, agora, um anel comutativo com unidade. Para cada a € R, o conjunto (a) = (ra |r € R}é um ideal, deno- 
minado ideal principal gerado por a. Se todo ideal de R for principal, diremos que R é um anel de ideais principais. 


DEFINIÇÃO Um anel comutativo com unidade R é denominado domínio de integridade ou, simplesmente, domí- 
nio, se R não tiver divisores de zero, ou seja, se ab = 0 implicar a = 0 ou b = 0 em R. 


DEFINIÇÃO Um anel comutativo com unidade R é denominado corpo se todo a € R não nulo tiver um inverso 
multiplicativo, isto é, se existir um elemento at eRtal que aa! =ala=1. 


Um corpo é, necessariamente, um domínio, pois ab = 0 e a Æ 0 implicam 


b=1.b=alab=a!.0=0 


Observamos que um corpo também pode ser visto como um anel comutativo em que os elementos não nulos for- 
mam um grupo com a multiplicação do anel. 


Exemplo B.5 O conjunto Z dos inteiros com as operações usuais de adição e multiplicação é o exemplo clássico 
de domínio com unidade. Cada ideal 1 de Z é principal, ou seja, Z = (n) para algum inteiro n. O anel quociente 
Z, = Z/(n) é denominado anel dos inteiros módulo n. Se n for primo, então Z, é um corpo. Por outro lado, se n não 
for primo, então Z, tem divisores de zero. Por exemplo, no anel Z,, temos Zę, 23 = 0, com 2 4 0€e3 0. 


Exemplo B.6 Os números racionais Q e os números reais R formam um corpo com as operações usuais de adição 
e multiplicação. 


Exemplo B.7 Seja Co conjunto dos pares ordenados de números reais com a adição e a multiplicação definidas por 
(a, b)+(cd)=(a+c,b+d) 
(a, b) - (c, d) = (ac — bd, ad + bc) 


Então C satisfaz todas as propriedades requeridas de um corpo. De fato, C é simplesmente o corpo dos números 
complexos (ver Seção 1.7). 


Exemplo B.8 O conjunto M de todas as matrizes 2 x 2 com entradas reais forma um anel comutativo com divi- 
sores de zero com as operações de adição matricial e multiplicação matricial. 


Exemplo B.9 Seja R um anel qualquer. Então o conjunto R[x] de todos os polinômios sobre R forma um anel com 
as operações usuais de adição e multiplicação polinomiais. Além disso, se R for um domínio, então R[x] também 
será um domínio. 


Seja D, agora, um domínio. Dizemos que b divide a em D se a = bc, para algum c € D. Dizemos que um ele- 
mento u € D é invertível se u divide 1, ou seja, se u tiver inverso multiplicativo. Dizemos que um elemento b € D 
é associado de a € D se b = ua, para algum invertível u € D. Um elemento não invertível p € D é denominado 
irredutível se p = ab implica que a ou b é invertível. 

Dizemos que um domínio é um domínio de fatoração única se todo elemento não invertível de D puder ser 
escrito de modo único (salvo associados e ordem) como um produto de elementos irredutíveis. 


Exemplo B.10 O anel Z dos inteiros é o exemplo clássico de domínio de fatoração única. Os elementos invertíveis 
de Z são 1 e —1. Os únicos associados de n € Z são n e —n. Os elementos irredutíveis de Z são os números primos. 


Exemplo B.11 O conjunto D = {a + bv'13 | a, b inteiros) é um domínio. Os invertíveis de D são +1,18 + 513 
e — 18+5v'13. Os elementos 2, 3 — v13 e —3 — v13 são irredutíveis em D. Observe que 


4=2.2=(3- 13)(-3 — 13). 


Assim, D não é um domínio de fatoração única. (Ver Problema B.40.) 
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B.4 MÓDULOS 


Sejam M um grupo abeliano aditivo e R um anel com unidade. Dizemos que M é um R-módulo (à esquerda), ou um 
módulo (à esquerda) sobre R, se existir uma aplicação R x M — M, denotada por justaposição, tal que 
MJ r(m + m) = rm + rm, 
[M,] (r + s)m = rm + sm 
[M;] (rs)m = r(sm) 
MJ Im=m 
para quaisquer r, s € R e m, m,, m, E M. 
Enfatizamos que um R-módulo é uma generalização de um espaço vetorial, já que, num módulo, permitimos 
que os escalares pertençam a um anel em vez de pertencerem a um corpo. 


Exemplo B.12 Seja G um grupo abeliano aditivo qualquer. O grupo G é um módulo sobre o anel Z dos inteiros 
definindo 


n vezes 
E RR 
ng=g+g+-+g, 0g=0, (-n)jg=-ng 


onde n é um inteiro positivo qualquer. 
Exemplo B.13 Sejam R um anel e Z um ideal de R. Então 1 pode ser visto como um módulo sobre R. 


Exemplo B.14 Sejam V um espaço vetorial sobre um corpo K e T:V — V um operador linear. Fazemos de V um 
módulo sobre o anel K[x] dos polinômios sobre K definindo fxv = HT)(v). O leitor deveria verificar que isto define 
uma multiplicação por escalar. 


Seja M um R-módulo. Um subgrupo aditivo N de M é denominado submódulo de M seu € N e r € R implicam 
ru € N. (Observe que, nesse caso, N é um R-módulo.) 

Sejam M e M' R-módulos. Dizemos que uma aplicação T:M — M' é um homomorfismo (ou R-homomorfis- 
mo ou R-linear) se 


O Tu +v) =T) +T) e Gi) Tou) = rTu) 


para quaisquer u, v E M erER. 


Problemas 


Grupos 


B.1 Decida se o sistema dado forma um grupo G. 
(i) G = conjunto dos inteiros, operação de subtração. 
(1) G = {1,—1 }, operação de multiplicação. 
Gii) G = conjunto dos números racionais não nulos, operação de divisão. 
Giv) G = conjunto das matrizes n x n não singulares, operação de multiplicação matricial. 


(v) G = {a + bi : a, b € Z}, operação de adição. 


B.2 Mostre que, num grupo G, valem as afirmações a seguir. 
(1) O elemento neutro de G é único. 
Gi) Cada a € G tem um único elemento inverso a”! € G. 
Gii (a!) =a, e (ab) != bla, 


(1v) ab = ac implica b = c e ba = ca implica b = c. 
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B.3 


B.4 


B.5 


B.6 


B.7 


B.8 


B.9 


B.10 


B.12 


B.13 


B.14 


B.16 


B.18 


B.19 


B.20 


Num grupo G, definimos as potências de a € G por 


0 n n—1 =n 


= aa" !, a™ = (a")', onden € N 


Mostre que valem as fórmulas seguintes, para quaisquer inteiros r, s, t € Z. 
(1) aa = as, (ii) (a) = a" (iii) (a5) = arstst, 


Mostre que se G é um grupo abeliano, então (ab)”= a”b”, para quaisquer a, b € G e qualquer inteiro n € Z. 
Suponha que G seja um grupo tal que (ab)? = abè, para quaisquer a, b € G. Mostre que G é abeliano. 


Seja H um subconjunto de um grupo G. Mostre que H é um subgrupo de G se, e só se, (i) H é não vazio e 
(ii) a, b € H implica ab“! € H. 


Prove que a interseção de um número qualquer de subgrupos de G também é um subgrupo de G. 


Mostre que o conjunto de todas as potências de a € G é um subgrupo de G, denominado subgrupo cíclico 
gerado por a. 


Dizemos que um grupo G é cíclico se G for gerado por alguma € G, ou seja, se G = {a” : n € Z}. Mostre 
que todo subgrupo de um grupo cíclico é cíclico. 


Seja G um grupo cíclico. Mostre que G é isomorfo ao grupo Z dos inteiros com a adição ou ao grupo Z, dos 
inteiros módulo n com a adição. 


Seja H um subgrupo de G. Mostre que as classes laterais à direita (à esquerda) de H particionam G em con- 
juntos dois a dois disjuntos. 


A ordem de um grupo G, denotada por |G|, é o número de elementos de G. Prove que se H é um subgrupo 
de um grupo finito G, então |H] divide |G]. (Este é o Teorema de Lagrange). 


Suponha que |G| = p, com p primo. Mostre que G é cíclico. 


Sejam H e N subgrupos de G, com N normal. Mostre que (i) HN é um subgrupo de G e (ii) H O N é um 
subgrupo normal de G. 


Seja H um subgrupo de G com somente duas classes laterais à direita (à esquerda). Mostre que H é um sub- 
grupo normal de G. 


Demonstre o Teorema B.1 Seja H um subgrupo normal de G. Então as classes laterais de H em G formam 
um grupo G/H com a multiplicação de classes. 


Seja G um grupo abeliano. Mostre que todo grupo quociente G/H também é abeliano. 


Seja f : G — G'um homomorfismo de grupos. Prove as afirmações dadas. 


(1) f(e) = e, em que e e é são as unidades de G e G’, respectivamente. 


(ii) fla!) =f(a) !, para cada a € G. 


Demonstre o Teorema B.2. Seja f : G — G’ um homomorfismo. Então o núcleo N de f é um subgrupo 
normal de G e o grupo quociente G/N é isomorfo à imagem de f. 


Seja G o grupo multiplicativo dos números complexos z tais que |z| = 1 e seja R o grupo multiplicativo dos 
números reais. Prove que G é isomorfo a R/Z. 
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B.21 Fixado g € G, defina ê : G — G por &(a) = g !ag. Mostre que G é um isomorfismo de G sobre G. 


B.22 Seja G o grupo multiplicativo das matrizes n x n não singulares sobre R. Mostre que a aplicação 4 + |4] 
é um homomorfismo de G no grupo multiplicativo dos números reais não nulos. 


B.23 Seja G um grupo abeliano. Fixado n € Z, mostre que a aplicação a ++ a” é um homomorfismo de G em G. 
B.24 Suponha que H e N sejam subgrupos de G, sendo N normal. Prove que H N N é normal em H e que 
H/(H A N)é isomorfo a HN/N. 
Anéis 


B.25 Mostre que num anel R valem as afirmações a seguir. 
G) a-0=0-a=0, (ii) a(—b) = (-a)b = —ab, (iii) (—a)(—b) = ab. 


B.26 Mostre que num anel com unidade R valem as afirmações a seguir. 
© (—1)a = —a, (ii) (-1)(-1) = 1. 


B.27 Seja R um anel e suponha que d =a, para cada a € R. Mostre que R é um anel comutativo. (Dizemos que 
um anel desses é um anel booleano.) 


B.28 Seja R um anel com unidade. Fazemos de R um outro anel Ê definindo aD b=a+b+lea-b= 
ab + a + b. (a) Verifique que R é um anel. (b) Encontre os elementos 0 e 1 de R. 


B.29 Seja G um grupo abeliano (aditivo) qualquer. Defina uma multiplicação em G por ab = 0. Mostre que isso 
faz de G um anel. 


B.30 Demonstre o Teorema B.3. Seja Z um ideal (bilateral) de um anel R. Então as classes laterais 
{a +I |a € R}formam um anel com a adição e multiplicação de classes. 


B.31 Sejam Z, e 7, ideais de um anel R. Prove que 7, + Le 1, NL também são ideais de R. 


B.32 Sejam R e R' anéis. Dizemos que uma aplicação f : R — R'é um homomorfismo (de anéis) se 
G) Ma+b)=fa)+f(b) e Gi) fab) =f(a)f(b), 
para quaisquer a, b € R. Prove que, se f : R — R' é um homomorfismo, então o conjunto N = (re R|f (r) = 0) é 
um ideal de R. (Esse ideal N é denominado núcleo de f.) 


Domínios e corpos 


B.33 Prove que num domínio D, se ab = ac, a + 0, então b = c. 


B.34 Prove que F = {a + bv2 


a, b racionais) é um corpo. 


B.35 Prove que F = (a +bv2 


a, b inteiros) é um domínio, mas não um corpo. 
B.36 Prove que um domínio D finito é um corpo. 
B.37 Mostre que os únicos ideais de um corpo K são {0} e K. 


B.38 Dizemos que um número complexo a + bi é um inteiro gaussiano se a, b forem inteiros. Mostre que o conjun- 
to G dos inteiros gaussianos é um domínio. Mostre, também, que os elementos invertíveis de G são +1 e +i. 
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B.39 Sejam D um domínio e Z um ideal de D. Prove que o anel quociente D/I é um domínio se, e só se, 1 é um 
ideal primo. (Dizemos que um ideal 7 é primo se ab € I implicar a € I ou b € 1.) 


B.40 Considere o domínio D = {a + bv'13 |a, b inteiros) (ver Exemplo B.11.) Sea = a + bv'13, definimos 
N(2) = a? — 13b°. Prove as afirmações dadas. (i) N(xf) = N («)N (P); Gi) « é uma unidade se, e só se, 
N(a) = 1; Gii) as unidades de D são +1, 18 +513 e — 18 +5v13, (iv) os números 2, 3 — v13 e 
— 3 — /13 são irredutíveis. 


Módulos 


B.41 Seja M um R-módulo. Mostre que se A e B são submódulos de M, então A + Be A N B também são submó- 
dulos de M. 


B.42 Sejam M um R-módulo e N um submódulo de M. Mostre que as classes laterais {u + N : u € M} for- 
mam um R-módulo com a adição de classes laterais e a multiplicação por escalar definida por r(u + N) 
= yu + N. (Esse módulo é denotado por M/N e é denominado módulo quociente.) 


B.43 Sejam Me M' R-módulos e seja f : M — M'um R-homomorfismo. Mostre que o conjunto N = {u E M : 
Fu) = 0} é um submódulo de M. (Esse submódulo é denominado núcleo de f.) 


B.44 Seja M um R-módulo e denote por E(M) o conjunto de todos os R-homomorfismos de M em si mesmo. De- 
fina as operações apropriadas de adição e multiplicação em E(M) de tal modo que E(M) se torne um anel. 


Apêndice C 


Polinômios Sobre um Corpo 


C.1 INTRODUÇÃO 


Neste apêndice investigamos os polinômios sobre um corpo K e mostramos que eles têm muitas propriedades que 
são análogas às dos números inteiros. Esses resultados desempenham um papel importante na obtenção das formas 
canônicas de um operador linear T de um espaço vetorial V sobre K. 


C.2 ANEL DE POLINÔMIOS 


Seja K um corpo. Formalmente, um polinômio f sobre K é uma sequência infinita de elementos de K em que todos, 
exceto um número finito deles, são nulos, como segue. 


f=(...,0,a,,..., 01,40) 


(Escrevemos a sequência de tal modo que ela se estenda para a esquerda em vez de para a direita.) O elemento a, é 
denominado k-ésimo coeficiente de f. Se n for o maior inteiro para o qual a, 0, então dizemos que n é o grau de 
fe escrevemos 


grauf=n 


Também dizemos que a, é o coeficiente dominante de fe, se a, = 1, dizemos que f é um polinômio mônico. Por 
outro lado, se cada coeficiente de f for igual a 0, dizemos que f é o polinômio nulo ou zero, e escrevemos f = 0. Não 
se define o grau do polinômio nulo. 

Se g for um outro polinômio sobre K, digamos, 


g=(...,0, -2m “+ bi, bo) 
então a soma f + g é o polinômio obtido pela soma dos coeficientes correspondentes. Isso é, se m < n, então 
f+g=(...,0, dp, .-.; ap tbm ---, a1 +by, do + bo) 
Além disso, o produto fg é o polinômio 
Jg = (. Pas 0, ED; ESRA aibo F agbı, agbo) 
ou seja, o k-ésimo coeficiente c, de fg é dado por 
k 
Ck = 2 ,a1bk-1 5 obp + aber + + agbo 
t=0 


Vale o teorema seguinte. 
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Teorema C.1 O conjunto P dos polinômios sobre um corpo K com as operações de adição e multiplicação forma 
um anel comutativo com unidade e sem divisores de zero, ou seja, é um domínio. Se fe g são polinômios não nulos 
de P, então grau(fg) = grau(f) grau(g). 
Notação 
Identificamos o escalar ay E€ K com o polinômio 
dy = (..., 0, ap) 
Também escolhemos um símbolo, digamos, t, para denotar o polinômio 
t=(...,0,1,0) 
Dizemos que t é uma indeterminada. Multiplicando t por si mesmo, obtemos 
E = (0,0, 10,0), P=(.0,0,1,0,0,0, 
Assim, podemos escrever o polinômio f dado na forma tradicional 
f =at Potato 
Quando escolhemos ź como a indeterminada, denotamos o anel de polinômios sobre K por 
Kit] 


e um polinômio f costuma ser escrito como f(t). 
Também consideramos K como um subconjunto de K[t], devido à identificação dada. Isso é possível porque as 
operações de adição e multiplicação de elementos de K são preservadas pela identificação, como segue. 


(..., 0, a) + (..., 0, bo) = (..., 0, ag + bo) 
(..., 0, ao): (.-., 0, bo) = (...,0, aobo) 


Observamos que os elementos não nulos de K são os invertíveis do anel K[t]. 

Também observamos que cada polinômio não nulo é um associado de um único polinômio mônico. Logo, se d 
e d' forem polinômios mônicos tais que d divide d’ e d' divide d, então d = d”. (Como em todo anel, dizemos que 
um polinômio g divide um polinômio f se existir um polinômio A tal que f = gh.) 


C.3 DIVISIBILIDADE 


O teorema seguinte formaliza a divisão polinomial. 


Teorema C.2 (Algoritmo de Divisão) Sejam fe g polinômios sobre um corpo K com g 0. Então existem poli- 
nômios q e r tais que 


f=qg+r 


em que, ou r = 0, ou grau r < grau g. 
Demonstração. Se f = O ou se grau f< grau g, então temos a representação procurada 


f=028+f 
Agora, suponha que grau f > grau g, digamos, 
J =4; + +a t e e=bit”++bt+b 


emquea,,b, 0 e n>m.Formamos o polinômio 


a 
h =f- "E 
i Dm (1) 


APÊnDiCE C * PoLinômios Sore um Corro ————— SMP 


Então grau f} < grau f. Por indução, existem polinômios q, e r tais que 
h=ng+r 

em que, ou r = 0, ou grau r < grau g. Substituindo em (1) e resolvendo, obtemos 

Eh 


1= (+; 


que é a representação procurada. 


rode +r 


m 


Teorema C.3 O anel KTt] de polinômios sobre um corpo K é um anel de ideais principais. Se 7 é um ideal de K[t], 
então existe um único polinômio mônico d que gera T, tal que d divide cada polinômio f € I. 


Demonstração. Seja d um polinômio de menor grau em 7. Como podemos multiplicar d por um escalar não 
nulo e ainda permanecer em 1, podemos supor, sem perda de generalidade, que d seja um polinômio mônico. Ago- 
ra, seja f € I dado. Pelo Teorema C.2, existem polinômios q e r tais que 


f= qd + r, em que, ou r = 0,ougraur< grau d. 


Agora, f, d € I implica qd € I e, portanto, r = f — qd € I. Como d é um polinômio de grau mínimo em 1, 
segue que r = 0 e f = dq, isto é, d divide f. Falta mostrar que d é único. Se d' for outro polinômio mônico que gera 
I, então d divide d' e d' divide d. Isso implica que d = d”, porque d e d' são mônicos. Assim, o teorema está demons- 
trado. 


Teorema C.4 Sejam fe g polinômios não nulos de K[t]. Então existe um único polinômio mônico d tal que (i) d 
divide fe g e (ii) se d' divide fe g, então d’ divide d. 


DEFINIÇÃO O polinômio d do teorema precedente é denominado máximo divisor comum de fe g. Sed = 1, então 
dizemos que fe g são primos entre si. 


Demonstração do Teorema C.4. O conjunto I = (mf + ng |m,n € K[t]) é um ideal. Seja d o polinômio mô- 
nico que gera 1. Como f, g € T, temos que d divide fe g. Suponha, agora, que d’ divide fe g. Seja J o ideal gerado 
por d'. Então f, g € Je, portanto, 1 C J. Dessa forma, d € J e, portanto, d’ divide d, como queríamos mostrar. 
Falta mostrar que d é único. Se d, for um outro máximo divisor comum (mônico) de fe g, então d divide d, e d, 
divide d. Isso implica que d = d,, porque d e d, são mônicos. Assim, o teorema está demonstrado. 


Corolário C.5 Seja d o máximo divisor comum dos polinômios fe g. Então existem polinômios m e n tais que 
d = mf + ng. Em particular, se fe g são primos entre si, então existem polinômios m e n tais que mf + ng = 1. 


O corolário segue diretamente do fato de d gerar o ideal 


I= {mf +ng|m, n € K[t]} 


C.4 FATORAÇÃO 
Dizemos que um polinômio p € K[t] de grau positivo é irredutível se p = fg implicar que f ou g é um escalar. 


Lema C.6 Suponha que p € KTt] seja irredutível. Se p divide o produto fg de polinômios f,g € KTf), então p 
divide f ou p divide g. Mais geralmente, se p divide o produto de n polinômios f,, f>» ..., f, então p divide algum 
desses polinômios. 


Demonstração. Suponha que p divida fg mas não f. Por ser p irredutível, os polinômios fe p devem ser primos 
entre si. Assim, existem polinômios m, n € K[t] tais que mf + np = 1. Multiplicando essa equação por g, obtemos 
g = mfg + npg. Como p divide fg e, portanto, mfg, p divide npg. Logo, p divide a soma g = mfg + npg. 
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Suponha, agora, que p divida ff -fa Se p dividir f,, estamos prontos. Caso contrário, pelo que acabamos de 
provar, p divide o produto f) + + fp. Por indução em n, p divide algum dos polinômios fo, ..., f, Assim, provamos o 
lema. 


Teorema C.7 (Teorema da Fatoração Única) Seja f um polinômio não nulo de K[f]. Então f pode ser escrito de 
modo único (exceto pela ordem dos fatores) como um produto 


f =p, Pn 


em que k € K e os p, são polinômios mônicos irredutíveis de KTf]. 

Demonstração. Começamos demonstrando a existência de tal produto. Se f for irredutível, ou se f € K, então 
tal produto claramente existe. Por outro lado, suponhamos que f = gh, onde fe g não são escalares. Então g e h têm 
grau menor do que o de f. Por indução, podemos supor que 


s=heagmg e h=hkhh-h, 
com ķi, k €Keosg,e h, são polinômios mônicos irredutíveis. Dessa forma, 
f = (kika)gig2 gh, oh, 


é a representação procurada. 
Mostremos, agora, a unicidade (exceto pela ordem dos fatores) dessa fatoração de f. Suponhamos que 


f=kpp,pa=kagom 


com k, k € K eos py py... Phs Q qo» -> Gy SãO polinômios mônicos irredutíveis. Agora, p, divide k'q, +` Qm- 
Como p, é irredutível, o lema precedente garante que p, deve dividir um dos g.. 
Digamos que p, divida q,. Como p; e q, são, ambos, irredutíveis e mônicos, p, = q,. Dessa forma, 


kp> Pa = Kg Am 


Por indução, temos que n = me p, = qn, .... P, = q, para algum rearranjo dos q, Também temos k = k'e o teorema 
está demonstrado. 

Se o corpo K for o corpo dos complexos C, é válido o resultado seguinte, conhecido como teorema fundamen- 
tal da Álgebra, cuja demonstração está fora do alcance deste texto. 


Teorema C.8 (Teorema Fundamental da Álgebra) Seja f(t) um polinômio não nulo sobre o corpo complexo C. 
Então f(t) pode ser escrito de modo único (exceto pela ordem) como um produto 


Ho) = kit = rr) (tr) 
em que k, r; € C, isto é, como um produto de polinômios de grau 1. 


No caso do corpo real R, temos o resultado a seguir. 


Teorema C.9 Seja f(t) um polinômio não nulo sobre o corpo real R. Então f(t) pode ser escrito de modo único 
(exceto pela ordem) como um produto 


S(O) = kpi ()p2(6) Pml) 


em que k € R e os p(t) são polinômios mônicos irredutíveis de grau 1 ou 2. 


Apêndice D 


Miscelânea 


D.1 INTRODUÇÃO 


Neste apêndice discutimos vários tópicos, tais como relações de equivalência, determinantes e matrizes em bloco 
e a inversa generalizada de Moore-Penrose. 


D.2 RELAÇÕES E RELAÇÕES DE EQUIVALÊNCIA 

Uma relação binária R ou, simplesmente, uma relação, de um conjunto A para um conjunto B atribui a cada par 
ordenado (a, b) € 4 x B exatamente uma das afirmações seguintes. 

(1) “a está relacionado com b”, denotado por a Rb; (ii) “a não está relacionado com b”. 


Uma relação de um conjunto A para o mesmo conjunto A é denominada relação em A. 
Observe que qualquer relação R de A para B define de modo único um subconjunto R de 4 x B, como segue. 


Ê = [(a,b)laRb) 
Reciprocamente, qualquer subconjunto Ê de 4 x B define uma relação de A para B, como segue. 
a R b se, e só se, (a, b) E R. 


Em virtude da correspondência dada entre relações de A para B e subconjuntos de 4 x B, redefinimos uma relação 
como segue. 


DEFINIÇÃO Uma relação R de A para B é um subconjunto de 4 x B. 


Relações de equivalência 


Considere um conjunto não vazio S. Uma relação R em S é denominada relação de equivalência em S se R for re- 
flexiva, simétrica e transitiva, ou seja, se R satisfizer os três axiomas seguintes. 


[E] (Reflexividade) Cada a € A está relacionado consigo mesmo, ou seja, para cada a € A, temos a R a. 

[E,] (Simetria) Se a está relacionado com b, então b está relacionado com a, ou seja, sea R a, então b Ra. 

[E,] (Transitividade) Se a está relacionado com b e b está relacionado com c, então a está relacionado com c, ou seja, 
seaRbebRc,entãoaRc. 


A ideia geral motivadora do conceito de relação de equivalência é a da classificação de objetos que, de alguma 
forma, são “iguais”. Claramente, a relação de igualdade é uma relação de equivalência. Por isso, muitas vezes usa- 
mos os símbolos ~ ou = para denotar uma relação de equivalência. 
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Exemplo D.1 


(a) Na Geometria Euclidiana, a semelhança de triângulos é uma relação de equivalência. De fato, se &, f, y são 
triângulos, então (1) « é semelhante a si mesmo, (ii) se « é semelhante a f, então f} é semelhante a g e (iii) se « 
é semelhante a 8 e p é semelhante a y, então « é semelhante a 7. 

(b) A relação € de inclusão de conjuntos não é uma relação de equivalência. A inclusão é reflexiva e transitiva, 
mas não é simétrica, porque 4 C B não implica B C 4. 


Relações de equivalência e partições 


Seja § um conjunto não vazio. Dizemos que uma partição de S é uma subdivisão de S em subconjuntos não vazios 
e dois a dois disjuntos, ou seja, uma coleção P = (A,) de subconjuntos não vazios de S tal que (1) cada a € S per- 
tence a algum dos A, e (ii) os conjuntos A, são dois a dois disjuntos. 

Os conjuntos de uma partição são denominados células. Assim, cada a € S pertence a exatamente uma das células. 
Também dizemos que um elemento b € 4 |; qualquer é um representante da célula A, e que um subconjunto B de S é um 
sistema de representantes da partição se B contiver exatamente um elemento de cada uma das células da partição. 

Suponha, agora, que R seja uma relação de equivalência num conjunto não vazio S. Para cada a € S, a classe 
de equivalência de a, denotada por [a], é o conjunto dos elementos de S relacionados com a, como segue. 


[a] = {x| a Rx} 
A coleção de classes de equivalência é denominada conjunto quociente de S por R e denotada por S/R. 
SIR = {[a]|a e S} 
A propriedade fundamental de uma relação equivalência e seu conjunto quociente é dada no teorema a seguir. 


Teorema D.1 Seja R uma relação de equivalência num conjunto não vazio S. Então o conjunto quociente S/R é 
uma partição de S. 
Exemplo D.2 Seja = a relação no conjunto Z dos inteiros definida por 

= y(mod 5) 


que se lê “x é congruente a y módulo 5” e que significa que a diferença x — y é divisível por 5. Então = é uma rela- 
ção de equivalência em Z. 
Existem exatamente cinco classes de equivalência no conjunto quociente Z/ =, como segue. 


A = {..., —10, —5, 0, 5, 10, ...} 
A ={..., —9, —4, 1, 6, 11,. D 
O E E Da 
r pa, =D, BB E E S, 
Ag E {aa 6 lA, 9, Mae} 


Observe que cada inteiro x, que pode ser escrito de modo único na forma x = 5q + r, com 0 < r < 5, é um elemen- 
to da classe de equivalência A,, em que r é o resto. Como esperamos, as classes de equivalência são disjuntas e sua 
união é Z. 


Z = Áo UA, UA, UA; U Á, 
Esse conjunto quociente Z/ = é denominado conjunto dos inteiros módulo 5 e denotado 
Z/5Z ou, simplesmente, Z5 


Em geral, escolhemos (0, 1, 2, 3, 4} ou (-2,-1,0, 1, 2} como um sistema de representantes das classes de equivalência. 
Analogamente, dado qualquer inteiro positivo m, existe uma relação de equivalência = definida por 


x = y(mod m) 


e o conjunto quociente Z/ = é denominado conjunto dos inteiros módulo m. 
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D.3 DETERMINANTES E MATRIZES EM BLOCO 


No Capítulo 8 vimos o teorema a seguir. 


Teorema 8.12 Seja M uma matriz triangular superior (inferior) em blocos com blocos diagonais 4,, A,, ..., A,. 
Então det(M) = det(4;) det(4,) -- - det(4,). 


A B 
Em vista desse resultado, se M = | 0 5 em que A é uma matriz r x r e D és x s, então det(M) = det(A) 


det(D). 


Teorema D.2 Considere a matriz em blocos M = | | em que A é uma matriz r X r não singular e D é 


C D 
s x s. Então det(M) = det(4) det(D — CA-!B), 
I i Ê B 


ca! Illo D- E e do teorema precedente. 


Demonstração. Decorre do fato de que M = | 
D.4 FATORAÇÃO DE POSTO TOTAL 


Dizemos que uma matriz B tem posto linha total r se B tem r linhas linearmente independentes. Dizemos que uma 
matriz C tem posto coluna total r se C tem r colunas linearmente independentes. 


DEFINIÇÃO Seja A uma matriz m x n de posto r. Dizemos que uma fatoração 
A= BC 
de A é uma fatoração de posto total se B tiver posto linha total r e C tiver posto coluna total r. 


Teorema D.3 Toda matriz A de posto r > 0 tem alguma fatoração de posto total. 


Existem várias fatorações de posto total de uma matriz A. A Figura D-1 dá um algoritmo para encontrar uma dessas 
fatorações. 


Algoritmo D.1 Dada qualquer matriz A de posto r > 0, este algoritmo produz uma fatoração de posto total de A. 
Passo 1 Encontre a forma canônica por linhas M de A. 
Passo 2 Seja B a matriz cujas colunas são as colunas de A correspondentes às colunas de M com 
pivôs. 
Passo 3 Seja C a matriz cujas linhas são as linhas não nulas de M. 


Então A = BC é uma fatoração de posto total de A. 


Figura D-1 


1 I =l 2 110 1 
Exemplo D.3 Sejam 4 = | 2 2 =l 3 | eM = fo 01 | a forma canônica por linhas de A. To- 
000 0 


mamos 
1 i 
1 1 0 1 
B= 2 — e Q= | | 
4 2 0 0 1 —1 


Então A = BC é uma fatoração de posto total de A. 
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D.5 INVERSA GENERALIZADA (MOORE-PENROSE) 


Nesta subseção vamos supor que o corpo de escalares seja o corpo complexo C. Dessa forma, A” indica a transpos- 
ta conjugada de uma matriz A. [Se A for uma matriz real, então A” = 4” 


DEFINIÇÃO Seja A uma matriz m x n sobre C. Dizemos que uma matriz A' é uma pseudoinversa de A, ou inver- 
sa de Moore-Penrose de A, se X = A” satisfaz as quatro equações a seguir. 


[MPJAXA =A, 
[MP,] XAX = X, 

IMP] (AX) = AX, 
[IMP XA)” = XA. 


+ 4 - 2 . ~ . ~ + -1 
Claramente, A é uma matriz n x m. Além disso, se A for não singular, então A =A . 


Lema D.4 A matriz A“ é única (se existir). 
Demonstração. Suponha que X e Y satisfaçam as quatro equações MP. Então 


AY = (AY)"”= (AXAY)”= (AVI (4X)"= AYAX = (AYA)X = AX 


Na primeira e quarta igualdades usamos [MP,] e na segunda e última usamos [MP ,]. Analogamente, usando [MP,] 
e [MP,], obtemos YA = XA. Então, 


Y = YAY = (YA)Y = (XA)Y = X(AY) = X(4X) =X 
em que na primeira igualdade usamos [MP,]. 


Lema D.5 Toda matriz A tem pseudoinversa A”. 
A Figura D-2 dá um algoritmo para encontrar a pseudoinversa de uma matriz A qualquer. 


Algoritmo D.1 Dada qualquer matriz m x n A sobre C de posto r, este algoritmo produz a inversa de Moo- 
re-Penrose A” de A. 


A A 
Passo 1 Troque as linhas e colunas de A de tal modo que PAQ = | Ph T | em que 4, é um 
21º 4» 


bloco não singular r x r. [Aqui, P e Q são os produtos de matrizes elementares correspon- 
dentes às trocas de linhas e colunas.] 


A o -1 
Passo 2 Defina B = Fe | eC = Is An Ap, em que 7, é a matriz identidade r x r. 
21 


Passo 3 Considere 4* = g eac (BB) "BP. 


Figura D-2 
Combinando os dois lemas precedentes, obtemos o teorema seguinte. 


Teorema D.6 Toda matriz A sobre C tem uma única matriz A” de Moore-Penrose. 
Quando A tiver posto linha total ou posto coluna total, temos os casos especiais a seguir. 


Teorema D.7 Seja A uma matriz sobre C. 
(a) Se 4 tem posto coluna total (as colunas de A são linearmente independentes), então 4” = 
(ABA) 
(b) Se 4 tem posto linha total (as linhas de A são linearmente independentes), então 4" = Ar 
(AMB 


Arênnice D * MISCELÂNEA —————— Aa 


Teorema D.8 Sejam A uma matriz sobre C e A = BC uma fatoração de posto total de A. Então 


A+ = C+B+* = CĦ(CCĦ)' (B"B) 'BY 
Além disso, 44" = BB! e AtA = CHC. 


Exemplo D.4 Considere a fatoração de posto total A = BC do Exemplo D.3, ou seja, 


1 1 — 2 I =l 
A= 2 2 -l1 3| = 2 =l Ê r ; i= 
-1 -1 2 —3 —1 2 


Então 


1 3 


mad 1/6 5 saa If 4 TA 
A E AG 2) E | 


2 

1 1/2 1 1 1/2 
c= fi 3) ecni 
l 


D.6 SOLUÇÃO DE MÍNIMOS QUADRADOS 


Considere um sistema AX = B de equações lineares. A solução de mínimos quadrados de AX = B é o vetor de 
menor norma euclidiana que minimiza ||4X — B!|,. Esse vetor é dado por 


X =4A*B 
[No caso em que A é invertível, temos 4* = A`! e, portanto, X = 47! B, que é a única solução do sistema.) 


Exemplo D.5 Considere o sistema AX = B a seguir. 


x+y-—-z+2t=1 
2x+2y —-z+3t1=3 
—x—y+22-3t=2 


Então, usando a matriz obtida no Exemplo D.4, 


1 1 -1 2 1 
4=|2 2-1 3|, B=|3|, 4t=— 
=] = 2 = 2 


Em vista disso, 
X = AB = (1/55)[85, 85, 105, —20]"= [17/11, 17/11, 21/11, —4/11]" 


é o vetor de menor norma euclidiana que minimiza ||4X — Bl. 
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